Me gustaría probar en lo de regresión se ajusta a mis datos mejor. Mi variable dependiente es un recuento, y tiene un montón de ceros.
Y necesitaría un poco de ayuda para determinar cuál es el modelo y la familia (poisson o quasipoisson, o cero-inflado de regresión de poisson), y cómo, para probar las hipótesis.
- De Regresión de Poisson: como tengo entendido, el fuerte suposición es que la variable dependiente media = varianza. ¿Cómo se prueba esto? Cómo cerrar juntos tienen que ser? Se incondicional o condicional de la media y la varianza se utiliza para esto? ¿Qué debo hacer si esta hipótesis no se sostiene?
- He leído que si la varianza es mayor que la media tenemos sobredispersión, y una posible manera de lidiar con esto es la inclusión de más variables independientes, o de la familia=quasipoisson. ¿Esta distribución tiene otros requisitos o supuestos? Prueba de lo que lo uso para ver si (1) o (2) se ajusta mejor, simplemente,
anova(m1,m2)
? - También he leído que negativo-distribución binomial puede ser utilizado cuando sobredispersión aparece. ¿Cómo puedo hacer esto en R? ¿Cuál es la diferencia para quasipoisson?
-
Cero-inflado de Regresión de Poisson: he leído que el uso de la vuong prueba comprueba cuál de los modelos se ajusta mejor.
> vuong (model.poisson, model.zero.poisson)
Es eso correcto? ¿Qué supuestos no un cero-inflado de regresión?
-
UCLA Académico de los Servicios de Tecnología, Estadística Consulting Group tiene una sección sobre cero-inflado Regresiones de Poisson, y la prueba de la zeroinflated el modelo (a) en contra de los estándares de poisson modelo (b):
> m.a <- zeroinfl(count ~ child + camper | persons, data = zinb)
> m.b <- glm(count ~ child + camper, family = poisson, data = zinb)
> vuong(m.a, m.b)
No entiendo lo de la | persons
parte del primer modelo, y por qué usted puede comparar estos modelos. Yo había esperado que la regresión a ser el mismo y sólo tiene que utilizar una familia diferente.