18 votos

De regresión de Poisson con grandes datos: es malo para cambiar la unidad de medida?

Debido a que el factorial en una distribución de poisson, se vuelve poco práctico para estimar modelos de poisson (por ejemplo, mediante máxima verosimilitud) cuando las observaciones son de gran tamaño. Así, por ejemplo, si yo estoy tratando de estimar un modelo para explicar el número de suicidios en un año dado (sólo datos anuales están disponibles), y decir, hay miles de suicidios cada año, es malo para expresar los suicidios en cientos, de modo que 2998 sería 29.98 ~= 30? En otras palabras, es malo para cambiar la unidad de medida para hacer que los datos manejable?

19voto

Jorge Castro Puntos 184

Cuando usted está tratando con una distribución de Poisson con grandes valores de \lambda (parámetro), es común el uso de una aproximación normal a la distribución de Poisson.

Como este sitio menciona, es del todo correcto uso de la aproximación normal cuando \lambda tiene más de 20, y la aproximación mejora a medida \lambda es aún mayor.

La distribución de Poisson se define sólo en el espacio de estado que consiste en los enteros no negativos, por lo que reescalado y el redondeo se va a introducir cosas extrañas en sus datos.

Con el modo normal de aprox. para la ampliación de las estadísticas de Poisson es MUY común.

7voto

ESRogs Puntos 1381

En caso de Poisson es malo, ya que cuenta son los recuentos -- su unidad es una unidad. Por otro lado, si quieres utilizar algún software avanzado como R, su manejo de Poisson funciones serán conscientes de la gran cantidad y utilizar algunos trucos numéricos para manejarlos.

Obviamente estoy de acuerdo en que la aproximación normal es una buena aproximación.

4voto

Berek Bryan Puntos 349

La mayoría de los paquetes estadísticos tienen una función para calcular el logaritmo natural de la factorial directamente (por ejemplo, la lfactorial() en función de R, la lnfactorial() función en Stata). Esto le permite incluir el término constante en la log-verosimilitud, si quieres.

3voto

Iwasakabukiman Puntos 518

Me temo que usted no puede hacer eso. Como @Baltimark estados, con gran lambda la distribución se realizará de la forma más normal (simétrica), y con el escalado hacia abajo, no será de poisson distrubución. Pruebe el siguiente código en R:

poi1 = rpois(100000, lambda = 5)  # poisson
poi2 = rpois(100000, lambda = 100)/20 # scaled-down poisson
poi2_dens = density(poi2)

hist(poi1, breaks = 0:30, freq = F, ylim = range(poi2_dens$y))
lines(poi2_dens, col = "red")

El resultado es el siguiente:

enter image description here

Se puede ver que la reducción de escala de poisson (línea roja) es completamente diferente de la distribución de poisson.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X