Para analizar los recuentos de aves con inflación cero me gustaría aplicar modelos de recuento con inflación cero utilizando el paquete R pscl . Sin embargo, echando un vistazo al ejemplo proporcionado en la documentación para una de las funciones principales ( ?zeroinfl ), empiezo a dudar de cuál es la ventaja real de estos modelos. De acuerdo con el código de ejemplo que allí se da, calculé modelos poisson estándar, cuasi poisson y bionomial negativo, modelos poisson simple inflado por cero y binomial negativo y modelos poisson inflado por cero y binomial negativo con regresores para el componente cero. Luego inspeccioné los histogramas de los datos observados y ajustados. (Aquí está el código para replicar eso).
library(pscl)
data("bioChemists", package = "pscl")
## standard count data models
fm_pois <- glm(art ~ ., data = bioChemists, family = poisson)
fm_qpois <- glm(art ~ ., data = bioChemists, family = quasipoisson)
fm_nb <- glm.nb(art ~ ., data = bioChemists)
## with simple inflation (no regressors for zero component)
fm_zip <- zeroinfl(art ~ . | 1, data = bioChemists)
fm_zinb <- zeroinfl(art ~ . | 1, data = bioChemists, dist = "negbin")
## inflation with regressors
fm_zip2 <- zeroinfl(art ~ fem + mar + kid5 + phd + ment | fem + mar + kid5 + phd +
ment, data = bioChemists)
fm_zinb2 <- zeroinfl(art ~ fem + mar + kid5 + phd + ment | fem + mar + kid5 + phd +
ment, data = bioChemists, dist = "negbin")
## histograms
breaks <- seq(-0.5,20.5,1)
par(mfrow=c(4,2))
hist(bioChemists$art, breaks=breaks)
hist(fitted(fm_pois), breaks=breaks)
hist(fitted(fm_qpois), breaks=breaks)
hist(fitted(fm_nb), breaks=breaks)
hist(fitted(fm_zip), breaks=breaks)
hist(fitted(fm_zinb), breaks=breaks)
hist(fitted(fm_zip2), breaks=breaks)
hist(fitted(fm_zinb2), breaks=breaks)!
No veo ninguna diferencia fundamental entre los distintos modelos (aparte de que los datos del ejemplo no me parecen muy "cero-inflados"...); en realidad, ninguno de los modelos arroja una estimación medianamente razonable del número de ceros. ¿Alguien puede explicar cuál es la ventaja de los modelos "cero-inflados"? Supongo que habrá habido alguna razón para elegirlo como ejemplo para la función.