Estoy trabajando en cero-inflado los datos del conteo de los modelos de uso de la pscl
paquete. Me pregunto por qué no hay desarrollo de modelos para un inflado de los datos del conteo de los modelos! También por qué no hay desarrollo de bimodal, decir cero-y-2-inflados, los datos del conteo de los modelos! Una vez que me genera una inflado de Poisson de datos y encontró que ni la glm
con family=poisson
modelo ni la binomial negativa (glm.nb
) modelo era lo suficientemente bueno para que se ajuste a los datos. Si alguien puede arrojar algo de luz sobre mi pensamiento, excéntrico pesar de que podría ser, sería muy útil para mí.
Respuesta
¿Demasiados anuncios?Una inflado modelo de Poisson para un recuento $Y_i$ es
$$\Pr(Y_i = 1) = \pi_i +(1-\pi_i)\cdot\mu_i\mathrm{e}^{-\mu_i} \\ \Pr(Y_i = y_i) = (1-\pi_i)\cdot\frac{\mu_i^{y_i}\mathrm{e}^{-\mu_i}}{y_i!} \qquad \text{si } y_i\neq 1$$
donde la distribución de Poisson media de $\mu_i$ & probabilidad de Bernoulli $\pi_i$ están relacionadas con los predictores medio de las correspondientes funciones de enlace. Se puede definir un modelo similar para inflar las probabilidades para los valores que usted elija.
Aún así, el cero tiene un especial (y una vez controvertido) entre los números de contar—en un sentido que representa la ausencia de algo para contar. Y es la "nada" frente a "algo" distinción, en lugar de "uno" vs "cualquier otro" número de distinción que tiende a ser relevante a través de una amplia gama de fenómenos que nos gusta el modelo: hay un proceso que le da un cero, uno, dos, ... cuente y otra que no da cuenta a todos.