Yo soy el análisis de datos de recuento con un modelo lineal generalizado en R. empecé con una familia de distribuciones Poisson la distribución, pero entonces se dio cuenta de que los datos fue claramente overdispersed. Entonces tomé la opción de aplicar un glm con distribución binomial negativa (yo estoy usando la función glm.nb()
de la MASA del paquete). Curiosamente, tengo la misma mejor modelo seleccionado con una adelante y una hacia atrás paso a paso de selección de enfoque, que es:
m.step2 <- glm.nb(round(N.FLOWERS) ~ Hs_obs+RELATEDNESS+CLONALITY+PRODUCTION, data = flower[c(-12, -17), ])
A continuación, para la prueba de efectos fijos puedo usar el análisis de varianza() función, lo que da:
anova(m.step2, test = "Chi")
Analysis of Deviance Table
Model: Negative Binomial(1.143), link: log
Response: round(N.FLOWERS)
Terms added sequentially (first to last)
Df Deviance Resid. Df Resid. Dev Pr(>F)
NULL 15 40.674
Hs_obs 1 9.5978 14 31.076 0.001948 **
RELATEDNESS 1 9.4956 13 21.581 0.002060 **
CLONALITY 1 3.0411 12 18.540 0.081181 .
PRODUCTION 1 3.7857 11 14.754 0.051693 .
Signif. codes: 0 ‘***' 0.001 ‘**' 0.01 ‘*' 0.05 ‘.' 0.1 ‘ ' 1
Warning messages:
1: In anova.negbin(m.step2, test = "F") : tests made without re-estimating 'theta'
Sin embargo, si hubo sobredispersión (incluso con la binomial negativa) estos valores de p deben ser corregidos, no? En mi caso, el valor residual de la desviación (obtenido a partir de la summary(m.step2)
) es 14.754 y residual grados de libertad 11. Por lo tanto, sobredispersión es 14.754/11 = 1.34.
¿Cómo puedo corregir los valores de p para dar cuenta de la pequeña cantidad de sobredispersión detectado en este modelo binomial negativo?