14 votos

Intuitivamente entender por qué la distribución de Poisson es el caso límite de la distribución binomial

En "Análisis de Datos" por D. S. de Sivia, no es una derivación de la distribución de Poisson, de la distribución binomial.

Ellos argumentan que la distribución de Poisson es el caso límite de la distribución binomial cuando $M\rightarrow\infty$ donde $M$ es el número de ensayos.

Pregunta 1: ¿Cómo puede el argumento de que intuitivamente se entiende?

Pregunta 2: ¿por Qué es el gran$M$ límite de $\frac{M!}{N!(M-N)!}$ igual a $\frac{M^{N}}{N!}$ donde $N$ es el número de éxitos en $M$ de las pruebas? (Este paso se utiliza en la derivación.)

6voto

Nicolae S. Puntos 41

Permítanme dar una alternativa heurística. Yo voy a mostrar cómo aproximar el proceso de Poisson como una binomial (y argumentan que la aproximación es mejor que muchos de los ensayos con baja probabilidad). Por lo tanto, la distribución binomial debe tender a la distribución de Poisson.

Digamos que los acontecimientos se suceden con una velocidad constante en el tiempo. Queremos conocer la distribución de la cantidad de eventos que sucedió en un día, sabiendo que el número esperado de eventos es $\lambda$.

Así, se espera que el número de eventos por hora es $\lambda/24$. Vamos a suponer que esto significa que la probabilidad de un evento que ocurre en una determinada hora, se $\lambda/24$. [no es muy correcta, pero es una buena aproximación si $\lambda/24 \ll 1$, básicamente si podemos asumir múltiples eventos no ocurren en la misma hora]. Entonces podemos aproximar la distribución del número de eventos como un binomio con $M=24$ ensayos, cada uno con probabilidad de éxito $\lambda/24$.

Podemos mejorar la aproximación al cambiar nuestro intervalo de minutos. Entonces es $p=\lambda/1440$ $M=1440$ ensayos. Si $\lambda$ es de alrededor de, digamos 10, entonces podemos estar bastante seguros de que ni un minuto había dos eventos.

Por supuesto, esto se pone mejor si pasamos a los segundos. Ahora estamos buscando a $M=86400$ eventos, cada uno con la pequeña probabilidad de $\lambda/86400$.

No importa cómo es grande su $\lambda$ es, puedo, finalmente, elegir una lo suficientemente pequeño como $\Delta t$ tal que es muy probable de que no hay dos eventos ocurren en el mismo intervalo de tiempo. A continuación, la distribución binomial correspondiente a ese $\Delta t$ será un excelente partido a la verdadera distribución de Poisson.

O en otras palabras, la distribución binomial tiende a la distribución de Poisson como $M \to \infty$ si la probabilidad de éxito es $p=\lambda/M$.

6voto

heropup Puntos 2278

El problema es que su caracterización de la distribución de Poisson como un caso límite de la distribución binomial es no es del todo correcto como se indica.

La distribución de Poisson es un caso límite de la binomial cuando: $$M \to \infty \quad \color{red}{\text{and} \quad Mp \to \lambda.}$$ The second part is important. If $p$ permanece fijo, la primera condición implica que la tasa también va a aumentar sin límite.

Lo que la distribución de Poisson se supone es que los eventos son raros. Lo que queremos decir por "raro", no es que la tasa de eventos es pequeña, de hecho, un proceso de Poisson puede tener una muy alta intensidad $\lambda$--, sino más bien, que la probabilidad de que ocurra un evento en cualquier instante en el tiempo $[t, t + dt)$ es muy pequeña. Esto es en contraste con un modelo binomial donde la probabilidad de $p$ de un evento (por ejemplo, el "éxito") es fijo para cualquier prueba.

Para ilustrar, supongamos que tenemos un modelo de una serie de $M$ ensayos de Bernoulli independientes, cada uno con probabilidad de éxito $p$, y observamos lo que sucede con la distribución del número de éxitos $X$$M \to \infty$. Para cualquier $N$ tan grande como queramos, y no importa cuán pequeño $p$ es, el número esperado de éxitos $\operatorname{E}[X] = Mp > N$$M > N/p$. Dicho de otra manera, no importa lo improbable que la probabilidad de éxito, con el tiempo se puede lograr una media de número de éxitos tan grandes como usted por favor, si usted suficientemente realizar muchas pruebas. Por eso, $M \to \infty$ (o, simplemente diciendo "$M$ es grande"), no es suficiente para justificar un modelo de Poisson para $X$.

No es difícil establecer de manera algebraica $$\Pr[X = x] = e^{-\lambda} \frac{\lambda^x}{x!}, \quad x = 0, 1, 2, \ldots$$ as a limiting case of $$\Pr[X = x] = \binom{M}{x} p^x (1-p)^{M-x}, \quad x = 0, 1, 2, \ldots, M$$ by setting $p = \lambda/M$ and letting $M \to \infty$. Other answers here have addressed the intuition behind this relationship and provided computational guidance as well. But it is important that $p = \lambda/M$. Usted no puede ignorar esto.

5voto

Nir Puntos 8003

Pregunta 1

Recordemos la definición de la distribución binomial:

una distribución de frecuencia del número posible de resultados exitosos en un determinado número de ensayos en cada una de las cuales hay la misma probabilidad de éxito.

Compare esto con la definición de la distribución de Poisson:

una discreta distribución de frecuencia que da la probabilidad de que un número de independientes de eventos que ocurren en un fijo de tiempo.

La diferencia sustancial entre el 2 es el binomial es $n$ ensayos, de Poisson es a través de un período de tiempo $t$. ¿Cómo puede el límite se producen de forma intuitiva?

Digamos que usted tiene que mantener ejecución de ensayos de Bernoulli para toda la eternidad. Por otra parte, corres $n = 30$ por minuto. Por cada minuto que cuente cada éxito. Así por toda la eternidad está ejecutando un $Bin(p,30)$ proceso de cada minuto. Más de 24 horas, usted tiene un $Bin(p,43200)$.

Como te cansas, te preguntan "¿cuántos éxitos se produjeron entre las 18:00 y 19:00?". Estás respuesta podría ser $30*60*p$, es decir, que proporcione el promedio de éxitos en una hora. Que se parece mucho a la de Poisson de parámetro $\lambda$ a mí.

5voto

Gaz Davidson Puntos 2064

Pregunta 2)

$$\frac{\frac{M!}{N!(M-N)!}}{\frac{M^N}{N!}} = \frac{M(M-1)\dots(M - N + 1)}{M^N} = 1(1 - \frac{1}{M})\dots(1 - \frac{N - 1}{M})$$

Así que tomando el límite fijo $N$

$$\lim_{M \to \infty} \frac{\frac{M!}{N!(M-N)!}}{\frac{M^N}{N!}} = \lim_{M \to \infty} 1(1 - \frac{1}{M})\dots(1 - \frac{N - 1}{M}) = 1$$

5voto

kjetil b halvorsen Puntos 7012

Voy a intentar una explicación sencilla e intuitiva. Registro que para una variable aleatoria binomial $X \sim \text{Bin}(n,p)$ tenemos la expectativa es $n p$ y la varianza es $n p (1-p)$. Ahora creo que el $X$ registra el número de eventos en un muy gran número de $n$ de los ensayos, cada uno con una probabilidad muy pequeña $p$, de tal manera que estamos muy cerca de $1-p=1$ (realmente $\approx$). Luego tenemos a $np=\lambda$ dicen, y $n p (1-p) \approx n p 1 =\lambda$, para la media y la varianza son iguales a $\lambda$. A continuación, recordar que para una distribución de poisson distribuido variable aleatoria, siempre tenemos la media y la varianza de la igualdad! Que es al menos un argumento de plausibilidad para la aproximación de poisson, pero no una prueba.

Luego lo mira desde otro punto de vista, el punto de proceso de poisson https://en.wikipedia.org/wiki/Poisson_point_process en la línea real. Esta es la distribución de puntos al azar en la línea que nos llega si puntos al azar se producen de acuerdo a las reglas:

  1. puntos en intervalos disjuntos son independientes
  2. la probabilidad de un punto aleatorio en un intervalo muy corto es proporcional a la longitud del intervalo
  3. la probabilidad de dos o más puntos en un intervalo muy corto es esencialmente cero.

A continuación, la distribución de número de puntos en un intervalo de tiempo dado (no necesariamente corto) es de Poisson (con el parámetro $\lambda$ proporcional a la longitud). Ahora, si dividimos el intervalo en muchos, igualmente muy corto subintervalos ($n$), la probabilidad de que dos o más puntos en un dado subinterval es esencialmente cero, por lo que el número de ha, para una muy buena aproximación, un bernolli de distribución, es decir, $\text{Bin}(1,p)$, por lo que la suma de todo esto va a ser $\text{Bin}(n,p)$, por lo que una buena aproximación de la distribución de poisson de número de puntos en que (de largo) de intervalo.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X