1 votos

Modelo lineal generalizado de efectos mixtos (GLMM) para detectar diferencias significativas en los datos de observación de aves

Estoy intentando analizar un conjunto de datos de conteo de aves asociados con una evaluación de impacto ambiental que estoy llevando a cabo, pero necesito expertos para hacerlo correctamente. No estoy seguro de cómo formular el modelo y completar la prueba, y determinar una diferencia estadística donde esté presente. Por lo tanto, mis preguntas son:

1) ¿Cómo debería formularse el modelo en R, específicamente qué factores deben asignarse como factores aleatorios; y

2) ¿Cómo se puede llevar a cabo la prueba de diferencias significativas entre tratamientos?

Los datos se pueden describir así:

  • Las observaciones son conteos de aves hechos por los encuestadores en el campo. Una observación puede ser un solo ave, o un grupo de 2 o más aves. Los datos están muy dispersos y un modelo binomial negativo parece ajustarse mejor a los datos al comparar los AICs (mejor que la alternativa, un modelo cuasi-poisson).
  • Hay tres factores fijos: Ubicación (las observaciones se hicieron en dos sitios, "sur" y "norte"), Mes (las aves en cada ubicación se contaron una vez al mes durante 6 meses) y Marea (en cada sitio y cada mes, se hicieron conteos separados en marea baja y marea alta).
  • Los conteos se realizaron durante un periodo de encuesta de 10 minutos (a menudo utilizado en la literatura), repetido 6 veces para muestrear la población en cada sitio y marea en cada mes; por lo tanto, el conteo duró en total una hora. Por lo tanto, parece correcto considerar los conteos de aves de cada muestra de 10 minutos como el factor aleatorio.

Los datos se pueden encontrar aquí: http://www.zen134994.zen.co.uk/glmm_bird_data.xlsx

El código R que he estado utilizando para mi análisis es el siguiente:

birdglmm <- glmer.nb(bird_count ~ month + site + tide + (1|sample_no), data = glmm_bird_data)
birdglmmoutput <- summary(birdglmm)
birdglmmanova <- anova(birdglmm)
birdglmmdrop1 <- drop1(birdglmm, test = "Chi")
summary(birdglmm)
anova(birdglmm)
drop1(birdglmm, test = "Chi")

0voto

Paul Joyce Puntos 11

Después de consultar a algunos estadísticos a los que me dirigieron colegas, claramente mi pregunta está mal formulada e intenta (incorrectamente) forzar un enfoque estadístico frecuentista clásico con uno basado en la teoría de la información.

El modelo determinará cuáles son los factores más importantes para describir los datos, lo cual se hace mediante la comparación de los AIC. Las pruebas de significación en el sentido Fisheriano-Neymann/Pearson no forman parte del flujo de trabajo, aunque dichas pruebas podrían emplearse de manera post-hoc para responder preguntas específicas.

En este caso, reformulé el análisis para generar modelos sucesivamente más complejos y comparé los AIC, por ejemplo:

bird_glmm_site <- glm.nb(bird_count ~ site, data = glmm_bird_data)
bird_glmm_month <- glm.nb(bird_count ~ month, data = glmm_bird_data)
bird_glmm_tide <- glm.nb(bird_count ~ tide, data = glmm_bird_data)
bird_glmm_sitexmonth <- glm.nb(bird_count ~ site + month, data = glmm_bird_data)
bird_glmm_sitextide <- glm.nb(bird_count ~ site + tide, data = glmm_bird_data)
bird_glmm_monthxtide <- glm.nb(bird_count ~ month + tide, data = glmm_bird_data)

Etc, incorporando más combinaciones de factores. El AIC más bajo fue para el modelo bird_count ~ site (909), mientras que otros modelos mostraron AICs de 924 en adelante. Los valores P para factores distintos a site no fueron significativos, mostrando que no eran significativamente diferentes de cero.

Por lo tanto, concluyo que hay una relación entre el conteo de aves y el sitio de estudio (uno que apoya números más altos de aves que otro), pero no hay evidencia de una relación entre el conteo de aves y el mes o la marea.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X