Debido a que el factorial en una distribución de poisson, se vuelve poco práctico para estimar modelos de poisson (por ejemplo, mediante máxima verosimilitud) cuando las observaciones son de gran tamaño. Así, por ejemplo, si yo estoy tratando de estimar un modelo para explicar el número de suicidios en un año dado (sólo datos anuales están disponibles), y decir, hay miles de suicidios cada año, es malo para expresar los suicidios en cientos, de modo que 2998 sería 29.98 ~= 30? En otras palabras, es malo para cambiar la unidad de medida para hacer que los datos manejable?
Respuestas
¿Demasiados anuncios?Cuando usted está tratando con una distribución de Poisson con grandes valores de \lambda (parámetro), es común el uso de una aproximación normal a la distribución de Poisson.
Como este sitio menciona, es del todo correcto uso de la aproximación normal cuando \lambda tiene más de 20, y la aproximación mejora a medida \lambda es aún mayor.
La distribución de Poisson se define sólo en el espacio de estado que consiste en los enteros no negativos, por lo que reescalado y el redondeo se va a introducir cosas extrañas en sus datos.
Con el modo normal de aprox. para la ampliación de las estadísticas de Poisson es MUY común.
En caso de Poisson es malo, ya que cuenta son los recuentos -- su unidad es una unidad. Por otro lado, si quieres utilizar algún software avanzado como R, su manejo de Poisson funciones serán conscientes de la gran cantidad y utilizar algunos trucos numéricos para manejarlos.
Obviamente estoy de acuerdo en que la aproximación normal es una buena aproximación.
Me temo que usted no puede hacer eso. Como @Baltimark estados, con gran lambda la distribución se realizará de la forma más normal (simétrica), y con el escalado hacia abajo, no será de poisson distrubución. Pruebe el siguiente código en R:
poi1 = rpois(100000, lambda = 5) # poisson
poi2 = rpois(100000, lambda = 100)/20 # scaled-down poisson
poi2_dens = density(poi2)
hist(poi1, breaks = 0:30, freq = F, ylim = range(poi2_dens$y))
lines(poi2_dens, col = "red")
El resultado es el siguiente:
Se puede ver que la reducción de escala de poisson (línea roja) es completamente diferente de la distribución de poisson.