2 votos

Cómo integrar información de ID en un GLM binomial.

Tengo datos de un experimento donde etiquetamos y liberamos langostas (n = 31) en un sitio de acuicultura y las seguimos durante un período de 2 meses.

La pregunta es simple: ¿las langostas permanecen más tiempo EN el sitio de acuicultura o FUERA (o no hay diferencia)?

Determinamos el tiempo (variable "Tiempo.min") que cada langosta (variable "ID") estuvo ubicada (variable "Loc") "Dentro" y "Fuera" del sitio de acuicultura, determinamos el tiempo total que la posición de cada langosta fue registrada por telemetría acústica (TotalT.min) y determinamos la proporción de tiempo que cada langosta pasó "Dentro" y "Fuera" del sitio de acuicultura (variable "Tiempo.prop").

Aquí hay un subconjunto de mis datos:

ID      Sexo    Tamaño   Loc     Tiempo.min     Total.min    Prop.tiempo
33199       F       63       Dentro    493            914          0.5394
33199       F       63       Fuera     421            914          0.4606
33205       M       68       Dentro    0              784          0
33205       M       68       Fuera     784            784          1
33206       M       69       Dentro    0              155          0
33206       M       69       Fuera     155            155          1
33207       F       62       Dentro    0              230          0
33207       F       62       Fuera     230            230          1
33208       M       66       Dentro    3969           6773         0.5860
33208       M       66       Fuera     2804           6773         0.4140
33210       F       63       Dentro    88             351          0.2515
33210       F       63       Fuera     263            351          0.7485
33211       F       58       Dentro    99             376          0.2630
33211       F       58       Fuera     277            376          0.7370
33212       M       84       Dentro    63             395          0.1593
33212       M       84       Fuera     332            395          0.8407
33213       M       63       Dentro    183            1029         0.1778
33213       M       63       Fuera     846            1029         0.8222
33214       M       73       Dentro    1522           2096         0.7263
33214       M       73       Fuera     574            2096         0.2736

Notarás que hay 2 observaciones para cada individuo (es decir, 1 observación "Dentro" del sitio de acuicultura y 1 observación "Fuera")

Creé este modelo que parece dar resultados sensatos:

glm.tiempo <- glm(Prop.tiempo ~ Loc + Sexo + Tamaño + Loc:Sexo + Loc:Tamaño + Sexo:Tamaño,
              weights = Total.min, family = quasibinomial, data = misdatos)
summary(glm.tiempo)

Llamada:
glm(formula = Prop.tiempo ~ Loc + Sexo + Tamaño + Loc:Sexo + Loc:Tamaño + 
Sexo:Tamaño, family = quasibinomial, data = misdatos, weights = Total.min)

Residuos de desviación: 
    Min       1Q   Mediana       3Q       Máx  
-126.19   -25.14     0.00    25.14   126.19  

Coeficientes:
              Estimación Error estándar Valor t Pr(>|t|)   
(Intercepción)  9.270e+00  1.120e+01   0.828  0.41137   
LocFuera      -1.854e+01  9.564e+00  -1.939  0.05769 . 
SexoM         1.885e+00  1.167e+01   0.161  0.87231   
Tamaño        -1.534e-01  1.868e-01  -0.821  0.41512   
LocFuera:SexoM -3.769e+00  1.223e+00  -3.082  0.00321 **
LocFuera:Tamaño  3.067e-01  1.591e-01   1.928  0.05905 . 
SexoM:Tamaño    1.561e-15  1.915e-01   0.000  1.00000   
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Parámetro de dispersión para la familia quasibinomial tomado como 2469.838)

    Devianza nula: 222187  en 61  grados de libertad
Devianza residual: 142158  en 55  grados de libertad
AIC: NA

Número de iteraciones de puntuación de Fisher: 5

Sin embargo, no sé si debo o cómo integrar la información sobre los individuos en mi modelo. Me parece que debería decirle al modelo que hay 31 individuos con la proporción de tiempo "Dentro" y la proporción de tiempo "Fuera". En este momento, parece más bien que hay 62 individuos, y 31 pasan algún tiempo "Dentro" y 31 pasan algún tiempo "Fuera".

¿Es adecuado mi modelo? Si no lo es, ¿sabes cómo integrar el ID a mi modelo?

0 votos

¿Cómo sabes el sexo de la langosta?

0 votos

Langostas fueron recolectadas usando jaulas, medidas, el sexo fue determinado visualmente (los machos y las hembras son ligeramente diferentes), una etiqueta acústica fue pegada en cada langosta, y fueron liberadas.

0 votos

El problema podría deberse a la clasificación incierta del sexo de la langosta.

1voto

avid Puntos 161

Su conjunto de datos es redundante. Siempre que un bogavante no está, está fuera, por lo que la segunda fila de su conjunto de datos no proporciona información que no haya sido proporcionada también por la primera, y así sucesivamente para todas las filas pares y la fila justo arriba de cada una de ellas. La redundancia de este tipo es una violación especialmente extrema de la suposición de muestreo independiente. Una vez que eliminas las filas pares, solo tienes una observación por bogavante, por lo que no es necesario considerar el ID del bogavante.

0 votos

Gracias @Kodiologist. Estoy de acuerdo con tu preocupación (por eso publiqué mi pregunta aquí) sin embargo, al hacer esto no puedo probar si pasan más tiempo dentro o fuera. Si observas mi pregunta original, pierdo mi variable "Loc" que es la más importante. ¿Cómo puedo solucionar esto?

1 votos

"al hacer esto no puedo probar si pasan más tiempo adentro o afuera" - Claro que puedes. Eso está determinado por la intersección. (O si no querías controlar todas esas otras variables, no te molestes con la regresión.)

0 votos

Sí sabré si pasan más tiempo dentro o fuera. Sin embargo, ¿cómo saber si eso es significativo o no? Según mi entendimiento, un intercepto significativo significa que el intercepto es significativamente diferente de cero, no necesariamente que los 2 grupos (tiempo dentro, tiempo fuera) son significativamente diferentes, ¿es correcto?

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X