28 votos

¿Por qué funciona la corrección de continuidad (decir, la aproximación normal a la distribución binomial)?

Me gustaría entender mejor cómo se derivó la corrección de continuidad de la distribución binomial para la aproximación normal.

¿Qué método se utilizó para decidir que debemos agregar 1/2 (¿por qué no otro número?). Cualquier explicación (o un enlace sugerido de lectura, que no sea este, se agradecería).

35voto

AdamSane Puntos 1825
  1. De hecho, no siempre el "trabajo" (en el sentido de mejorar siempre la aproximación de la binomial cdf por la normal en cualquier $x$). Si el binomio $p$ es de 0,5 creo que siempre ayuda, excepto quizás el más extremo de la cola. Si $p$ no está demasiado lejos de 0.5, razonablemente grande $n$ generalmente funciona muy bien, excepto en el extremo de la cola, pero si $p$ es cerca de 0 o 1 es posible que no ayuda en absoluto (véase el punto 6. a continuación)

  2. Una cosa a tener en cuenta (a pesar de ilustraciones casi siempre implican la fmp y en pdf) es que lo que estamos tratando de aproximarse es el cdf. Puede ser útil para reflexionar sobre lo que está pasando con la cdf de la binomial y la aproximación normal (por ejemplo, aquí es $n=20,p=0.5$):

    enter image description here

    En el límite de la cdf de una estandarizado binomial va a ir a una normal estándar (tenga en cuenta que afecta a la estandarización de la escala en el eje x pero no el eje de las y); a lo largo del camino, cada vez más, un gran $n$ el binomio cdf saltos tienden más uniforme de las faldas de los normal cdf.

    Vamos a acercar y veo esto en el anterior ejemplo sencillo:

    enter image description here

    Observe que, dado que la aproximación normal pasa cerca de la mitad de los saltos verticales*, mientras que en el límite de la normal cdf a nivel local es aproximadamente lineal y (como es la progresión de la binomial cdf en la parte superior de cada salto); como resultado, el cdf tiende a cruzar la horizontal pasos cerca de $x+\frac{_1}{^2}$. Si desea aproximar el valor de la binomial cdf, $F(x)$ a entero $x$, la normal cdf llega a esa altura de cerca de a $x+\frac{_1}{^2}$.

    * Si aplicamos Berry-Esseen a decir-corrigió variables de Bernoulli, la Baya-Esseen límites permitir que por muy poco margen de maniobra al $p$ es cerca de $\frac12$ $x$ es cerca de $\mu$ -- el normal cdf debe pasar razonablemente cerca de la mitad de los saltos allí, porque de lo contrario, la diferencia absoluta en cdf superará el mejor Berry-Essen enlazado en un lado o en el otro. Este a su vez se relaciona a cómo lejos de $x+\frac{_1}{^2}$ de la normal de la cdf puede cruzar parte horizontal de la binomial cdf paso a la función.

  3. La expansión en la motivación de que en 1. vamos a considerar cómo tendríamos que usar una aproximación normal a la binomial cdf para trabajar $P(X=k)$. E. g. $n=20, p=0.5, k=9$ (véase el segundo diagrama). Así que nuestra normal con la misma media y sd de es $N(10,(\sqrt{5})^2)$. Tenga en cuenta que nosotros aproximación sería el salto en el cdf a las 9 por el cambio en la normal cdf entre 8.5 y 9.5.

enter image description here

  1. Haciendo la misma cosa bajo el menos formal pero más "habitual" de libros de texto de la motivación (que es quizás más intuitivo, especialmente para los estudiantes principiantes), estamos tratando de aproximar una variable discreta por una continua. Podemos hacer una permanente versión de la binomial mediante la sustitución de cada una probabilidad de pico de altura $p(x)$ por un rectángulo de ancho 1 centrado en $x$, dándole la altura de la $p(x)$ (véase el rectángulo azul de abajo; imaginar una para cada valor de x) y, a continuación, se aproximan por la densidad normal con la misma media y sd como el original de la binomial:

    ![enter image description here

    El área debajo de la casilla que se aproxima a la normal entre los $x-\frac12$$x+\frac12$; los dos casi triangular partes que se encuentran por encima y por debajo de la horizontal de paso están muy juntos en el área. Algunas suma de probabilidades binomiales en un intervalo reducirá a una colección de estas aproximaciones. (El dibujo de un diagrama como este es a menudo muy útil si no es inmediatamente claro si necesita ir hacia arriba o hacia abajo por 0,5 para un determinado cálculo de ... trabajo que binomial valores que usted desea en su cálculo e ir a cualquier lado por $\frac12$ para cada uno).

    Se puede motivar a este enfoque algebraicamente mediante una derivación [a lo largo de las líneas de De Moivre-ver aquí o aquí, por ejemplo] para derivar la aproximación normal (aunque se puede realizar algo de manera más directa que De Moivre del enfoque).

    Que, básicamente, se procede a través de varias aproximaciones, incluyendo el uso de Stirling aproximación en el ${n \choose x}$ plazo y el uso de ese $\log(1+x)\approx x-x^2/2$ a obtener que

    $$P(X=x)\approx \frac{1}{\sqrt{2\pi np(1-p)}}\exp(-\frac{(x-np)^2}{2np(1-p)})$$

    es decir, que la densidad de una normal con una media de $\mu=np$ y la varianza $\sigma^2 = np(1-p)$ $x$ es aproximadamente a la altura de la binomial pmf en $x$. Esto es esencialmente donde De Moivre consiguió.

    Así que ahora consideran que tenemos un punto medio-regla de aproximación para áreas normales en términos de un binomio a las alturas ... que es, para $Y\sim N(np,np(1-p))$, la regla del punto medio, dice que $F(y+\frac12)-F(y-\frac12) = \int_{y-\frac12}^{y+\frac12}f_Y(u)du\approx f_Y(y)$ y hemos de de Moivre que $f_Y(x)\approx P(X=x)$. Flipping que sobre, $P(X=x)\approx F(x+\frac12)-F(x-\frac12)$.

    [Una similar "regla del punto medio" tipo de aproximación puede ser utilizado para motivar a otras aproximaciones de continuo fmp por densidades utilizando una continuidad de la corrección, pero uno siempre debe tener cuidado de prestar atención a donde tiene sentido invocar esa aproximación]

  2. Nota histórica: la continuidad de la corrección parece haberse originado con Augustus de Morgan, en 1838 como una mejora de De Moivre de la aproximación. Véase, por ejemplo Hald (2007)[1]. De Hald de la descripción de su razonamiento fue a lo largo de las líneas del punto 4. anteriormente (es decir, esencialmente en términos de tratar de aproximar el pmf mediante la sustitución de la probabilidad de la espiga con un "bloque" de ancho 1 centrada en el valor de x).

  3. Una ilustración de una situación en la que la continuidad de la corrección no ayuda:

    enter image description here

    En el gráfico de la izquierda (donde, como antes, $X$ es el binomio, $Y$ es la aproximación normal), $F_X(x)\approx F_Y(x+\frac12)$$p(x) \approx F_Y(x+\frac12)-F_Y(x-\frac12)$. En el gráfico a la derecha (el mismo binomio, sino aún más a la cola), $F_X(x)\approx F_Y(x)$ $p(x) \approx F_Y(x)-F_Y(x-1)$ -- lo que es decir que el desconocimiento de la continuidad de la corrección es mejor que el uso de esta región.

    [1]: Hald, Anders (2007),
    "Una Historia de la Inferencia Estadística Paramétrica de Bernoulli a Fisher, 1713-1935",
    Fuentes y Estudios en la Historia de las Matemáticas y las Ciencias Físicas,
    Springer-Verlag, Nueva York

1voto

noplay Puntos 603

Creo que el factor surge del hecho de que estamos comparando una distribución continua a una discreta. Así tenemos que traducir lo que significa cada valor discreto de la distribución continua. Nos podríamos elegir otro valor, no obstante esto sería desequilibrado sobre un entero dado. (es decir le peso la probabilidad de estar en 6 más hacia 7 a 5).

He encontrado un enlace útil aquí: enlace

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X