Tengo un conjunto de datos que contiene el número de acciones realizadas por los individuos en el curso de 7 días. La acción específica no debería ser relevante para esta pregunta. Aquí están algunas estadísticas descriptivas para el conjunto de datos: $$ \begin{array}{|c|c|} \hline \text{Range} & 0 - 772 \\ \hline \text{Mean} & 18.2 \\ \hline \text{Variance} & 2791 \\ \hline \text{Number of observations} & 696 \\ \hline \end{array} $$
Aquí es un histograma de los datos:
A juzgar por el origen de los datos, me imaginé que se ajuste a una distribución de Poisson. Sin embargo, la media ≠ varianza, y el histograma es el que se recurre a la izquierda. Además, me encontré con la goodfit
prueba en R y tengo:
> gf <- goodfit(actions,type="poisson", method = "MinChisq") <br>
> summary(gf) <br>
Goodness-of-fit test for poisson distribution <br>
X^2 df P(> X^2) <br>
Pearson 2.937599e+248 771 0
El método de Probabilidad Máxima también obtuvieron una p-valor = 0. Suponiendo que la hipótesis nula es: coincide con los datos de una distribución de Poisson (la documentación no especifica esto), entonces el goodfit
prueba dice que debemos rechazar la hipótesis nula, por lo tanto los datos no coincide con una distribución de Poisson.
Es que el análisis correcto? Si es así, ¿qué distribución crees que se ajuste a estos datos?
Mi objetivo final es comparar el número medio de acciones entre 2 muestras para ver si los medios son diferentes; es el control de la distribución, incluso, necesario? Mi entendimiento es la típica de las pruebas (z,t,$\chi^2$ pruebas) no funcionan para distribuciones de Poisson. ¿Qué pruebas debo usar si los datos es, en efecto Poisson se distribuye?