Tengo datos de un experimento donde etiquetamos y liberamos langostas (n = 31) en un sitio de acuicultura y las seguimos durante un período de 2 meses.
La pregunta es simple: ¿las langostas permanecen más tiempo EN el sitio de acuicultura o FUERA (o no hay diferencia)?
Determinamos el tiempo (variable "Tiempo.min") que cada langosta (variable "ID") estuvo ubicada (variable "Loc") "Dentro" y "Fuera" del sitio de acuicultura, determinamos el tiempo total que la posición de cada langosta fue registrada por telemetría acústica (TotalT.min) y determinamos la proporción de tiempo que cada langosta pasó "Dentro" y "Fuera" del sitio de acuicultura (variable "Tiempo.prop").
Aquí hay un subconjunto de mis datos:
ID Sexo Tamaño Loc Tiempo.min Total.min Prop.tiempo
33199 F 63 Dentro 493 914 0.5394
33199 F 63 Fuera 421 914 0.4606
33205 M 68 Dentro 0 784 0
33205 M 68 Fuera 784 784 1
33206 M 69 Dentro 0 155 0
33206 M 69 Fuera 155 155 1
33207 F 62 Dentro 0 230 0
33207 F 62 Fuera 230 230 1
33208 M 66 Dentro 3969 6773 0.5860
33208 M 66 Fuera 2804 6773 0.4140
33210 F 63 Dentro 88 351 0.2515
33210 F 63 Fuera 263 351 0.7485
33211 F 58 Dentro 99 376 0.2630
33211 F 58 Fuera 277 376 0.7370
33212 M 84 Dentro 63 395 0.1593
33212 M 84 Fuera 332 395 0.8407
33213 M 63 Dentro 183 1029 0.1778
33213 M 63 Fuera 846 1029 0.8222
33214 M 73 Dentro 1522 2096 0.7263
33214 M 73 Fuera 574 2096 0.2736
Notarás que hay 2 observaciones para cada individuo (es decir, 1 observación "Dentro" del sitio de acuicultura y 1 observación "Fuera")
Creé este modelo que parece dar resultados sensatos:
glm.tiempo <- glm(Prop.tiempo ~ Loc + Sexo + Tamaño + Loc:Sexo + Loc:Tamaño + Sexo:Tamaño,
weights = Total.min, family = quasibinomial, data = misdatos)
summary(glm.tiempo)
Llamada:
glm(formula = Prop.tiempo ~ Loc + Sexo + Tamaño + Loc:Sexo + Loc:Tamaño +
Sexo:Tamaño, family = quasibinomial, data = misdatos, weights = Total.min)
Residuos de desviación:
Min 1Q Mediana 3Q Máx
-126.19 -25.14 0.00 25.14 126.19
Coeficientes:
Estimación Error estándar Valor t Pr(>|t|)
(Intercepción) 9.270e+00 1.120e+01 0.828 0.41137
LocFuera -1.854e+01 9.564e+00 -1.939 0.05769 .
SexoM 1.885e+00 1.167e+01 0.161 0.87231
Tamaño -1.534e-01 1.868e-01 -0.821 0.41512
LocFuera:SexoM -3.769e+00 1.223e+00 -3.082 0.00321 **
LocFuera:Tamaño 3.067e-01 1.591e-01 1.928 0.05905 .
SexoM:Tamaño 1.561e-15 1.915e-01 0.000 1.00000
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Parámetro de dispersión para la familia quasibinomial tomado como 2469.838)
Devianza nula: 222187 en 61 grados de libertad
Devianza residual: 142158 en 55 grados de libertad
AIC: NA
Número de iteraciones de puntuación de Fisher: 5
Sin embargo, no sé si debo o cómo integrar la información sobre los individuos en mi modelo. Me parece que debería decirle al modelo que hay 31 individuos con la proporción de tiempo "Dentro" y la proporción de tiempo "Fuera". En este momento, parece más bien que hay 62 individuos, y 31 pasan algún tiempo "Dentro" y 31 pasan algún tiempo "Fuera".
¿Es adecuado mi modelo? Si no lo es, ¿sabes cómo integrar el ID a mi modelo?
0 votos
¿Cómo sabes el sexo de la langosta?
0 votos
Langostas fueron recolectadas usando jaulas, medidas, el sexo fue determinado visualmente (los machos y las hembras son ligeramente diferentes), una etiqueta acústica fue pegada en cada langosta, y fueron liberadas.
0 votos
El problema podría deberse a la clasificación incierta del sexo de la langosta.
0 votos
Gracias por tu interés @Michael. No determiné el sexo de las langostas yo mismo, pero sé que esto es muy fácil de hacer. Nuestro personal en el campo sabe qué buscar y obtiene el sexo correcto el 100% del tiempo, por lo que no hay incertidumbre allí. Mi pregunta es más sobre la forma en que analizo los datos que en los datos mismos. ¿Está bien tener 2 observaciones para cada langosta (como lo hice) o debería incluir de alguna manera la información sobre cada langosta (variable "ID") en el modelo (por ejemplo, utilizando un modelo mixto)?
0 votos
Dos observaciones por langosta no está bien.
0 votos
Ok gracias por tu aportación @Michael. ¿Tienes alguna sugerencia para arreglar esto? Intenté reorganizar mi conjunto de datos usando las variables "time.in" y "time.out". De esta manera tengo 1 observación por langosta con la proporción de tiempo dentro y fuera del sitio de acuicultura. Usando
cbind
ejecuté este modelo:glm.time.cbind <- glm(cbind(Time.in,Time.out)~Sex*Size, data = mydata2, family=quasibinomial)
. Sin embargo, mis resultados solo me dicen si el sexo y/o el tamaño afectan al tiempo dentro/fuera, pero no sé si realmente pasan más tiempo dentro o fuera.