Loading [MathJax]/jax/element/mml/optable/BasicLatin.js

8 votos

Qué tan representativa es la distribución de Poisson de la distribución de eventos en la realidad?

Siempre me he preguntado cómo es bueno es un 'ajuste' es la distribución de Poisson para los eventos que observamos en la realidad. Casi siempre he visto que se utiliza para el modelado de la ocurrencia de eventos. (Por ejemplo, la llegada de los coches en un garaje de estacionamiento o el número o los mensajes enviados/recibidos por los equipos hosts en una red, etc.)

Solemos modelo eventos por la Distribución de Poisson. Es la distribución sólo una buena primera aproximación a cómo suceden las cosas en la realidad? Si observo que el número de coches/día o mensajes/día en los dos ejemplos anteriores y los que son de la salida de 'recoger a partir de la distribución" ¿cuánto se diferencian? Cómo una buena aproximación de Poisson? (Es una aproximación?) ¿Qué es la "magia" detrás de Poisson que se pone a la derecha (intuitivamente hablando :)?

5voto

icelava Puntos 548

Un ejemplo que puedo hablar es de las ventas en los supermercados de Bienes de Consumo Envasados (CPG). Estos son también contar eventos - el supermercado puede vender 0 unidades al día, o 1, o 2, y así sucesivamente, por lo que la distribución de Poisson parece un buen primer ajuste.

Sin embargo, el subyacente de la distribución binomial @PeterEllis notas no se sostiene. Sí, podemos ser capaces de modelar el número de clientes con un binomio... pero algunos clientes por la compra de 1 unidad, algunos van a comprar 2 unidades y algunas de carga de sus despensas y compra de 10 unidades.

El resultado suele ser overdispersed, de modo que una distribución binomial negativa se adapta mucho mejor que la de Poisson. (De vez en cuando, incluso podemos ver underdispersion por muy rápido que se mueven elementos como la leche).

4voto

Eero Puntos 1612

Si las cosas que se cuentan son independientes el uno del otro y la velocidad es constante (o sigue un modelo como en el de regresión de poisson), a continuación, la distribución de Poisson se tienen en general bastante bien. Ejemplos como los coches que llegan en un garaje tienden a funcionar bastante bien (a lo largo de periodos de tiempo en el que el ritmo es bastante constante, incluyendo tanto a la hora punta y en el medio de la noche en un garaje frecuentado por los trabajadores de 9 a 5 no funcionan bien). ¿A qué hora llegas al garaje tendrá poco o influencia sobre lo que tiempo me llegan. Hay excepciones, sin embargo, en que si 2 personas se citan en un momento dado, entonces es probable que llegue más cerca juntos, si uno sigue al otro, entonces será aún más cerca. También cosas como el tráfico de cercanías de la luz podría causar grumos en las llegadas que no coinciden con una distribución de Poisson.

Si desea comparar un conjunto específico de datos para ver si la distribución de Poisson es una buena coincidencia, entonces usted puede utilizar un colgante rootogram.

2voto

kyle Puntos 274

Como @Stephan dice, la recta de Poisson no pueden tener suficiente de varianza para ser un buen modelo de real entero no negativo mediciones regido por una función de riesgo. Así que, a menudo, la binomial negativa es utilizada, que tiene un parámetro adicional α>0 determinación de la sobre-dispersión. He encontrado que es útil para parametrizar por β=ln(α) debido a que la sobre-dispersión α se aproxima a 0, es decir, la binomial negativa enfoques de Poisson, binomial negativa se convierte en difícil de calcular.

Otra manera de aumentar la dispersión es cero la inflación, que puede ser aplicado a cualquiera de Poisson o binomial negativa. Para el uso que, en cada tiempo de medición, la primera realización de un ensayo de Bernoulli (una moneda). Si la moneda es "jefes", la medición es de 0. De lo contrario, la medición se extrae de la distribución de Poisson o binomial negativa de distribución.

2voto

Amit Puntos 26

He visto que si los hechos resultan ser regular, a continuación, la distribución de poisson modelo sobreestima la varaiance (lógico y evidente), mientras que si los hechos resultan ser agrupado, a continuación, la distribución de poisson modelo subestima la varianza. La distribución de poisson se genera a partir de un aleatoria de Poisson proceso de punto, mi viejo libro de texto recomienda Cox, D. R. y Miller, H. D. (1965) "La teoría de los procesos estocásticos" pub. Wiley para su posterior lectura. En el libro de introducción a una de primer orden de la ecuación diferencial se deriva de un proceso aleatorio, que se ha resuelto a dar probabilty de observar no hay eventos en el tiempo, t, P(0,t) = e^(-a) donde a es la tasa de eventos y t es el tiempo, a continuación, considerando P(1,t), P(2,t) etc. el general de Poisson formuale es 'derivados' por la inspección. C. Chatfield "Estadísticas para la tecnología: un curso de estadística aplicada", 2ª Ed. 1978, pub. Chapman and Hall. consulte las páginas 70-75.

Esos dos ejemplos violar la uderlying aleatoriedad requisito. SI los eventos están más o menos al azar, a continuación, el modelo de Poisson es un modelo justo. coches de llegar de un ajetreado centro de la ciudad de aparcamiento puede ser un ejemplo de un clúster de conjunto de datos, es decir, debido a las 9 a 5 usuarios, tal vez ?

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X