45 votos

¿Hay algún ejemplo en el que no se cumpla el teorema del límite central?

Wikipedia dice -

En teoría de la probabilidad, el teorema del límite central (CLT) establece que, en la mayoría de las situaciones Cuando se suman variables aleatorias independientes, su suma debidamente normalizada tiende a una distribución normal (informalmente una "curva de campana") aunque las propias variables originales no estén distribuidas normalmente...

Cuando dice "en la mayoría de las situaciones", ¿en qué situaciones no funciona el teorema central del límite?

53voto

Parrotfish Journey Puntos 21

Para entenderlo, primero hay que enunciar una versión del Teorema Central del Límite. Este es el enunciado "típico" del teorema central del límite:

Lindeberg-Lévy CLT. Supongamos que ${X_1, X_2, \dots}$ es una secuencia de variables aleatorias i.i.d. variables aleatorias con $E[X_i] = \mu$ y $Var[X_i] = \sigma^2 < \infty$ . Sea $S_{n}:={\frac {X_{1}+\cdots +X_{n}}{n}}$ . Entonces, como $n$ se acerca al infinito, las variables aleatorias $\sqrt{n}(S_n − \mu)$ convergen en la distribución a una normal $N(0,\sigma^2)$ es decir

$${\displaystyle {\sqrt {n}}\left(\left({\frac {1}{n}}\sum _{i=1}^{n}X_{i}\right)-\mu \right)\ {\xrightarrow {d}}\ N\left(0,\sigma ^{2}\right).}$$

¿En qué se diferencia de la descripción informal y cuáles son las lagunas? Hay varias diferencias entre su descripción informal y esta descripción, algunas de las cuales se han discutido en otras respuestas, pero no completamente. Así que podemos convertir esto en tres preguntas específicas:

  • ¿Qué ocurre si las variables no están idénticamente distribuidas?
  • ¿Y si las variables tienen una varianza infinita, o una media infinita?
  • ¿Qué importancia tiene la independencia?

Tomando estos uno a la vez,

No se distribuye de forma idéntica Los mejores resultados generales son las versiones de Lindeberg y Lyaponov del teorema del límite central. Básicamente, siempre que las desviaciones estándar no crezcan demasiado, se puede obtener un teorema del límite central decente.

Lyapunov CLT.[5] Supongamos ${X_1, X_2, \dots}$ es una secuencia de variables aleatorias independientes, cada una con un valor esperado finito $\mu_i$ y la varianza $\sigma^2$ Definir: $s_{n}^{2}=\sum _{i=1}^{n}\sigma _{i}^{2}$

Si para algunos $\delta > 0$ , la de Lyapunov condición ${\displaystyle \lim _{n\to \infty }{\frac {1}{s_{n}^{2+\delta }}}\sum_{i=1}^{n}\operatorname {E} \left[|X_{i}-\mu _{i}|^{2+\delta }\right]=0}$ se satisface, entonces una suma de $X_i − \mu_i / s_n$ converge en su distribución a una variable aleatoria normal a medida que n llega al infinito:

${{\frac {1}{s_{n}}}\sum _{i=1}^{n}\left(X_{i}-\mu_{i}\right)\ {\xrightarrow {d}}\ N(0,1).}$

Varianza infinita Existen teoremas similares al teorema del límite central para variables con varianza infinita, pero las condiciones son bastante más estrictas que las del teorema del límite central habitual. Esencialmente, la cola de la distribución de probabilidad debe ser asintótica a $|x|^{-\alpha-1}$ para $0 < \alpha < 2$ . En este caso, los sumandos escalados apropiados convergen a un Levy-Alpha distribución estable.

La importancia de la independencia Hay muchos teoremas de límite central diferentes para secuencias no independientes de $X_i$ . Todos ellos son muy contextuales. Como señala Batman, hay uno para Martingales. Esta cuestión es un área de investigación en curso, con muchas, muchas variaciones diferentes dependiendo del contexto específico de interés. Esta pregunta en Math Exchange hay otro post relacionado con esta cuestión.

23voto

Ofir Baruch Puntos 121

Aunque estoy bastante seguro de que ya se ha respondido antes, aquí va otra:

Existen varias versiones del teorema del límite central, siendo la más general que, dadas funciones de densidad de probabilidad arbitrarias, la suma de las variables se distribuirá normalmente con un valor medio igual a la suma de los valores medios, así como que la varianza será la suma de las varianzas individuales.

Una restricción muy importante y relevante es que la media y la varianza de las pdfs dadas tienen que existir y deben ser finitas.

Por lo tanto, tome cualquier pdf sin valor medio o varianza - y el teorema del límite central ya no se mantendrá. Así que toma una distribución Lorentziana por ejemplo.

16voto

Aksakal Puntos 11351

No, el CLT siempre se mantiene cuando se cumplen sus supuestos. Calificaciones como "en la mayoría de las situaciones" son referencias informales a las condiciones en las que debe aplicarse el CLT.

Por ejemplo, una combinación lineal de variables independientes de la distribución de Cauchy no sumará la variable de distribución normal . Una de las razones es que la varianza no está definida para Distribución de Cauchy , mientras que CLT pone ciertas condiciones a la varianza, por ejemplo, que tiene que ser finita. Una implicación interesante es que, dado que las simulaciones de Montecarlo están motivadas por la CLT, hay que tener cuidado con las simulaciones de Montecarlo cuando se trata de distribuciones de cola gorda, como la de Cauchy.

Tenga en cuenta que hay un versión generalizada de CLT. Funciona para varianzas infinitas o indefinidas, como la distribución Cauchy. A diferencia de muchas distribuciones que se comportan bien, la suma de números de Cauchy debidamente normalizada sigue siendo Cauchy. No converge a la gaussiana.

Por cierto, no sólo la Gaussiana sino muchas otras distribuciones tienen PDFs en forma de campana, por ejemplo la t de Student.

10voto

Christoph Hanck Puntos 4143

Aquí está una ilustración de la respuesta de querubín, un histograma de 1e6 dibuja de escala (por $\sqrt{n}$ ) y las medias muestrales estandarizadas (por la desviación estándar de la muestra) de las distribuciones t con dos grados de libertad, tales que el la varianza no existe .

Si se aplicara el CLT, el histograma de $n$ tan grande como $n=2000$ debe parecerse a la densidad de una distribución normal estándar (que, por ejemplo, tiene una densidad $1/\sqrt{2\pi}\approx0.4$ en su punto álgido), lo que evidentemente no ocurre.

enter image description here

library(MASS)
n <- 2000
std.t <- function(n){
  x <- rt(n, df = 2)
  sqrt(n)*mean(x)/sd(x)
}
samples.from.t <- replicate(1e6, std.t(n))
xax <- seq(-5,5, by=0.01)
truehist(samples.from.t, xlim = c(-5,5), ylim = c(0,0.4), col="salmon")
lines(xax, dnorm(xax), col="blue", lwd=2)

8voto

Jeff Bauer Puntos 236

Un caso sencillo en el que la CLT no se puede mantener por razones muy prácticas, es cuando la secuencia de variables aleatorias se acerca a su límite de probabilidad estrictamente de un lado . Esto se encuentra, por ejemplo, en los estimadores que estiman algo que se encuentra en un límite.

El ejemplo estándar aquí quizás sea la estimación de $\theta$ en una muestra de uniformes i.i.d. $U(0,\theta)$ . El estimador de máxima verosimilitud será el estadístico de máximo orden, y se acercará a $\theta$ necesariamente sólo desde abajo: pensando ingenuamente, ya que su límite de probabilidad será $\theta$ el estimador no puede tener una distribución "alrededor" de $\theta$ - y el CLT ha desaparecido.

El estimador correctamente escalado tiene una distribución límite, pero no de la variedad "CLT".

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X