22 votos

¿Cómo puede el teorema del límite central mantenga para las distribuciones que tienen límites con respecto a la variable aleatoria?

Siempre he tomado problema con el, y nunca se le ha dado una buena respuesta, porque cómo es posible que el teorema del límite central - la versión clásica donde la distribución de la muestra significa enfoques de la normalidad - se puede aplicar a decir de Poisson o la distribución Gamma, donde $P(x<0)=0$. O, para el caso, cualquier otra forma de distribución para que $\exists X:X \neq -\infty ,F(X)=0$, o quizás $\exists X:X \neq \infty, 1-F(X)=0$.

Como un ejemplo, dada una distribución Gamma, como el número de muestras $n \rightarrow \infty$, $P( \bar{X} = \alpha) \rightarrow 1$, $\forall \alpha \geq 0$, para algunos $\bar{X}_i$. Pero si $\alpha<0$, $P(\bar{X}=\alpha)=0$. Simplemente nunca, NUNCA, una $\bar{X}_i<0$. Esto me sugiere que la distribución de $\bar{X}$ no se puede, ni se acerca, normalidad debido a $f(\bar{X})$ debe ser necesariamente $0$, $\forall \bar{X}<0$, que no cumple con los requisitos de una distribución normal donde $f(y)>0, \forall y \in R$.

Me iba a sentir mucho mejor acerca de la vida y cualquier cosa basada en la CLT si alguien me podría ayudar a entender dónde mi lógica se ha ido por mal camino.

25voto

Aaron Puntos 36

Esta es una excelente pregunta, ya que muestra que usted está pensando acerca de la intuitiva aspectos de los teoremas que se aprende. Que te pone por delante de la mayoría de los estudiantes que aprenden de la CLT. Aquí voy a tratar de suministro de usted con una explicación de cómo es posible que la CLT mantener para variables aleatorias con apoyo limitado.

El clásico teorema central del límite se aplica a cualquier secuencia $X_1, X_2, X_3, ... \sim \text{IID Dist}(\mu, \sigma^2)$ consiste independientes e idénticamente distribuidas al azar variables arbitrarias media de $\mu$ y finito distinto de cero de la varianza $0 < \sigma^2 < \infty$. Ahora, supongamos que usted tiene una secuencia, y están delimitadas por $x_{\text{min}} \leqslant X_i \leqslant x_{\text{max}}$, y por lo tanto su apoyo no cubre la totalidad de la línea real.

El teorema del límite central se refiere a la distribución de la media muestral $\bar{X}_n \equiv \tfrac{1}{n} \sum_{i=1}^n X_i$, y del apoyo limitado sobre el subyacente de las variables aleatorias en la secuencia, esta estadística también debe tener obedecer los límites de $x_{\text{min}} \leqslant \bar{X}_n \leqslant x_{\text{max}}$. Así, la trama se hace más espesa - la media de la muestra que es el tema de que el teorema es también limitada! ¿Cómo puede el CLT si este es el caso?

Teorema del Límite Central (CLT): Dejando $\Phi$ ser el estándar de la distribución normal de la función, tenemos:

$$\lim_{n \rightarrow \infty} \mathbb{P} \Big( \frac{\bar{X}_n - \mu}{\sigma / \sqrt{n}} \leqslant z \Big) = \Phi (z).$$

Aproximación derivadas de CLT: Para un gran $n$ tenemos el aproximado de la distribución:

$$\bar{X}_n \sim \text{N} \Big( \mu, \frac{\sigma^2}{n} \Big).$$

El problema deriva del hecho de que la distribución de la aproximación que se deriven de este teorema se aproxima a una distribución limitada de apoyo por uno con el infinito apoyo, y por lo tanto, no puede ser correcta. Tienes razón en eso --- la distribución de la aproximación de un gran $n$ es sólo una aproximación, y de hecho mis-especificar la probabilidad de que la media muestral está fuera de sus límites (por dar esta probabilidad positiva).

Sin embargo, la CT no es una declaración acerca de una distribución aproximación finita $n$. Se trata de la limitación de la distribución de la normalizado de la media de la muestra. Los límites de esta cantidad son:

$$z_{\text{min}} = \frac{x_{\text{min}} - \mu}{\sigma / \sqrt{n}} \leqslant \frac{\bar{X}_n - \mu}{\sigma / \sqrt{n}} \leqslant \frac{x_{\text{max}} - \mu}{\sigma / \sqrt{n}} = z_{\text{max}}.$$

Ahora, como $n \rightarrow \infty$ tenemos límites de $z_{\text{min}} \rightarrow - \infty$$z_{\text{max}} \rightarrow \infty$, lo que significa que los límites de la normalizado de la media de la muestra se vuelven más y más, y convergen en el límite a toda la recta real. (O, para decirlo un poco más formalmente, para cualquier punto en la recta real, los límites abarcará punto de que para algunos lo suficientemente grande $n$.) Una consecuencia de esto es que la probabilidad atribuida a las partes fuera de los límites por la distribución normal converge a cero, como se $n \rightarrow \infty$.

Aquí llegamos al corazón de la cuestión con respecto a tus dudas acerca de la CLT. Es cierto que para cualquier finito $n$, una aproximación normal a la distribución de la media de la muestra dará probabilidad positiva subconjuntos de valores que están fuera de los límites de la verdad de apoyo. Sin embargo, cuando tomamos el límite de $n \rightarrow \infty$ esta errónea probabilidad positiva converge a cero. La distribución de la aproximación a la normalización de la media de la muestra converge a la verdadera distribución de esta cantidad en el límite, incluso a pesar de que la aproximación no contener exactamente para finitos $n$.

5voto

Josh Pearce Puntos 2288

El origen de la confusión proviene de dos fuentes:

1) La CLT se aplica a la normalizado de la muestra de medios, es decir:

$Z_n=\frac{S_n/n-\mu}{\sigma/\sqrt{n}}=\frac{S_n-n\mu}{\sigma\sqrt{n}}$,

que se centra alrededor de 0, por lo tanto, admite valores negativos con probabilidad positiva. Como un ejemplo extremo, si $n=1$ $\frac{X_1-\mu}{\sigma}$ puede ser negativo para Poisson $X_1$. De hecho, usted puede fácilmente a la conclusión de que si $Z_n$ nunca es negativa, entonces la $X_i$ debe ser constante (por lo tanto,$\sigma=0$).

2) La CLT para finito $n$ es sólo un local de resultado alrededor de la media. En otras palabras, el hecho de que $P(Z_n\leq x)$ es de aproximadamente $\phi(x)$ (el normal CDF), normal tiende a ser más cierto para $x$ cerca de 0. Al $n$ no es grande suficiente, relativa a $x$, esta aproximación se rompe.

Si usted está decir, la medición de las alturas de la gente, luego de un estándar de la aproximación normal puede implicar que la negativa de altura tiene probabilidad positiva. Esto es falso, ya que la mayoría de los adultos tienen alturas entre 4 y 7 metros, por lo que la aproximación se vendría abajo más allá de estos límites si su $n$ es pequeña.

Alternativamente, si $P(X_i=1)=0.99999$$P(X_i=-1)=0.00001$, entonces tomará muchas realizaciones de $X_i$ inferir situaciones donde $X_i$ es negativo, de modo que $Z_n$ la mayoría va a ser positivo, y puede que (erróneamente) a la conclusión de que nunca puede ser negativo.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X