3 votos

Por qué una suma de distribución sesgada a la izquierda se distribuye normalmente según el teorema del límite central

El teorema del límite central dice que una suma de variables aleatorias i.i.d. tiene una distribución normal. Ahora tengo un gran número de variables aleatorias (100.000 respuestas a un ítem de un cuestionario) pero la distribución está sesgada hacia la izquierda. Así que con tantos encuestados puedo preguntar incluso a 1Millón la distribución no cambiará.

Entonces, tal vez no lo entiendo bien, pero ¿no debería (según el teorema central del límite) esta distribución ser normal?

Además he leído que

$$ S_n = X_1 + ... + X_n $$ y

$$ Z_n = \frac{S_n - \mu n}{\sigma \sqrt(n)} $$

¿Significa eso que toda distribución que se puede convertir en una distribución normal mediante una transformación lineal es una distribución normal? (esto debería ser casi todo).

7voto

Nixit Patel Puntos 34

¿Significa eso que toda distribución [...] es normal?

No es que la distribución sea normal, sino que la suma o la media de un lote de valores extraídos de esa distribución tiende a extraerse de una distribución normal.

Una distribución, por definición, no cambia si se extrae una muestra, un millón de muestras o $10^{10}$ muestras. Pero la suma o la media de las muestras no proceden de la misma distribución de las muestras.

Tal vez un pequeño ejemplo en R puede ayudar a aclarar esto. Una distribución beta con parámetros de forma 1 y 50 está lejos de ser una distribución normal. Puedes graficarla usando R y el comando:

curve(expr = dbeta(x, 1, 50))

enter image description here >

Ahora tomemos 10000 muestras de esa distribución, de un tamaño de 100 cada una, y calculemos sus sumas. Ahora vamos a dibujar un histograma de estas sumas:

hist(replicate(10000, sum(rbeta(100, 1, 50))), breaks = 50)

Histogram of sums of beta(1,50) distibuted samples

se puede ver fácilmente, cómo esto se acerca a la distribución normal. No la distribución beta se convierte en normal, pero la distribución de las sumas.

2voto

user164061 Puntos 281

La asimetría disminuye para la suma $Z_n = \frac{S_n - \mu n}{\sigma \sqrt(n)}$ cuando $n$ está aumentando.

Tienes para los primeros tres momentos centrales que

$$ \begin{array}{} \mu_1(Z_n) &=& 0 \\ \mu_2(Z_n) &=& 1 \\ \mu_3(Z_n) &=& \frac{\mu_3(X)}{\sigma\sqrt{n}} \end{array}$$

esto se podría derivar utilizando el propiedades de los cumulantes para los que los tres primeros se refieren a los momentos centrales. Se podrían derivar relaciones similares para momentos de orden superior (pero más complicadas) y acabar con la teorema del límite central que se puede ver como la desaparición de los cumulantes de orden superior a 2.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X