2 votos

Intuición: ¿Por qué dividimos por $\sqrt{n}$ en lugar de $n$ en el Teorema del Límite Central?

La ley de los grandes números, por ejemplo, es muy fácil de entender. Sumas las variables aleatorias y las divides por su cantidad. Tomas el límite casi seguro de la media aritmética y terminas con la expectativa. A quién no le gusta esto?

Ahora, para el Teorema del Límite Central (CLT) consideramos la convergencia en distribución, por lo que me doy cuenta de que la lógica es diferente. Permíteme presentar una versión simple como referencia:

Sea $(X_n)_{n \in \mathbb{N}}$ una secuencia de variables aleatorias i.i.d. con $E[X_1]=0$ y $Var(X_1) = \sigma^2$ donde $0< \sigma <\infty$. Entonces tenemos que

$$ G_n := \frac{1}{\sqrt{n \sigma^2}} \sum_{k = 1}^{n} X_k \overset{d}{\longrightarrow} G$$

donde $G \sim N(0,1)$

He visto más de una demostración para el CLT pero son bastante técnicas. Durante mucho tiempo ignoré este problema, pero se está repitiendo en varios otros teoremas que encontré (por ejemplo, el teorema de Donsker para los procesos de sumas parciales) así que ahora realmente quiero entender. ¿Existe una intuición sobre de dónde viene la raíz cuadrada?

2voto

G. Chiusole Puntos 45

Quieres que $G_n$ sea una variable aleatoria normalizada, es decir, $E(G_n) = 0$ y $\text{Var}(G_n) = 1$. Esto se logra al trasladar $\sum_{i = 1}^n X_i$ por $n E(X_i)$ y dividir por $\sqrt{n \sigma^2}$, ya que la varianza es cuadrática.

Entonces lo que obtienes es

$$ E(G_n) = E(\frac{\sum_{i = 1}^n X_i - n E(X_i)}{\sqrt{n \sigma^2}}) = \frac{n E(X_i) - n E(X_i)}{\sqrt{n \sigma^2}} = 0$$

$$ \text{Var}(G_n) = \text{Var}(\frac{\sum_{i = 1}^n X_i - n E(X_i)}{\sqrt{n \sigma^2}}) = \frac{n \text{Var}(X_i) - 0}{n \sigma^2} = 1$$

Si no normalizas la variable aleatoria, realmente no puedes esperar ningún tipo de convergencia. En el caso de la ley de los grandes números, las varianzas tienden a $0$ (razón por la que se espera que converja a una constante).

$$ \text{Var}(\frac{\sum_{i = 1}^n X_i}{n}) = \frac{ n \text{Var}(X_i)}{n^2} \rightarrow 0$$

Más generalmente, si buscas distribuciones límite interesantes, la pregunta de "cuánto" se necesita normalizar es muy importante. Si converges "demasiado poco", la secuencia no convergerá. Si normalizas "demasiado" (como en la ley de los grandes números), la secuencia convergerá a algo constante (aunque puede dar información significativa). Si converges "justo correctamente", como en el TCL, obtienes una distribución significativa.

Hay más de un factor de normalización significativo. Por ejemplo, el factor de normalización $\frac{1}{\sqrt{2n \ln(\ln(n))}}$ da la ley del logaritmo iterado, de la cual también se puede extraer información.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X