3 votos

Elegir una distribución para tratar con sobre-dispersion

Estoy trabajando en un problema de seguros de vida: tratando de simular el monto total de reclamaciones en un año. Para hacer esto, tengo un registro para cada persona que contiene su cantidad de seguro y una estimación de la probabilidad de que presenten una reclamación durante el próximo año. He realizado miles de simulaciones de un año y he desarrollado el rango de resultados.

Desafortunadamente, la experiencia histórica real es mucho más volátil de lo que mi análisis sugiere. Casi cada año parece ser de 1 cada 100 años. Utilicé la distribución binomial (pensando simplistamente que una persona presenta o no una reclamación), pero me han aconsejado que mis datos sufren de sobredispersión. Eso suena posible, porque obviamente no conocemos realmente la probabilidad precisa de cada persona de presentar una reclamación. Nuestra estimación es incorrecta para cada individuo en particular, pero razonablemente precisa para cada subgrupo. La solución recomendada fue utilizar una distribución binomial negativa para que la varianza pueda ser calibrada por separado de la media.

Ciertamente esta propiedad sería útil, pero la literatura sobre la distribución binomial negativa se centra en aplicaciones de conteo de éxitos y fracasos. Eso no parece relevante para lo que estoy tratando de hacer. ¿Realmente es esta una buena distribución de probabilidad para usar en este contexto, y por qué?

3voto

AdamSane Puntos 1825

Si deseas simular la probabilidad de reclamo de un individuo (y esas son tus propias palabras, así que asumo que sí), eso es una variable aleatoria continua, no discreta.

La discreta estaría relacionada con algo posterior: si un individuo hizo o no un reclamo.

Con homogeneidad de probabilidad entre individuos, un modelo con un $p$ fijo para todos obviamente subestimaría la variación en las probabilidades de hacer un reclamo, ya que asume que es 0.

La probabilidad de un reclamo podría ser modelada, por ejemplo, por una distribución _beta_, y el evento "el asegurado hizo un reclamo" se distribuiría condicionalmente según esa probabilidad, y luego, incondicionalmente, el número de reclamos en muchas pólizas sería una distribución beta-binomial.

Esto tiene bastante flexibilidad para modelar datos donde las cuentas son 1 o 0, y el modelo para $p$ es fácilmente interpretable (como un modelo para la homogeneidad en la probabilidad de reclamos).

1voto

kjetil b halvorsen Puntos 7012

Después de tu respuesta en los comentarios: ¡No hay razón por la que no puedas usar modelos binomiales negativos! Si intentas buscar en Google "modelos sobre-dispersos para el número de reclamaciones de seguros", hay muchos resultados que parecen relevantes.

Ten en cuenta que el modelo binomial negativo se puede ver como un modelo poisson donde el parámetro medio de poisson tiene una distribución. Usando ideas como estas, también puedes construir otros modelos de sobre-dispersión.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X