En el modelado de reclamar el recuento de datos en un entorno de seguros, comencé con la de Poisson, pero entonces se dio cuenta de sobredispersión. Un Cuasi-Poisson mejor modelado la mayor media de la varianza de la relación de los básicos de Poisson, pero me di cuenta de que los coeficientes fueron idénticos en ambos casos de Poisson y Cuasi-modelos de Poisson.
Si esto no es un error, ¿por qué está sucediendo esto? ¿Cuál es el beneficio de la utilización de Cuasi-Poisson más de Poisson?
Cosas a tener en cuenta:
- El subyacente de que las pérdidas son de un exceso de base, que (creo) impidió la Tweedie de trabajo -, pero fue la primera distribución que lo intenté. Yo también examinó la NOTA, POSTAL, ZINB, y Obstáculo modelos, pero aún así la Cuasi-Poisson proporciona el mejor ajuste.
- He probado de sobredispersión a través de dispersiontest en el AER paquete. Mi parámetro de dispersión fue de aproximadamente 8.4, con p-valor a los 10^-16 magnitud.
- Estoy usando glm() con la familia = poisson o quasipoisson y un vínculo al registro de para el código.
- Cuando se ejecuta el código de Poisson, me salen con las advertencias de "En dpois(y, mu, log = TRUE) : no-entero x = ...".
Útil SE los Hilos por Ben orientación: