5 votos

¿Se aplica el teorema del límite central a estas funciones de densidad de probabilidad?

Supongamos que tenemos n variables aleatorias uniformes de 0 a 1. La distribución de la media de estas variables se aproxima a la normalidad con el aumento de n según el teorema del límite central. Sin embargo, ¿qué pasaría si en lugar de que todas las variables fueran aleatorias, se garantizara que una de ellas fuera 0 y otra 1? Esto se daría en el siguiente caso: Supongamos que tienes n=7 números generados aleatoriamente del 0 al 1 y que son, de menor a mayor, [.1419 .1576 .4854 .8003 .9572 .9649 .9706]. Si restáramos el número más pequeño a todos los números y luego dividiéramos todos los números por el nuevo máximo, obtendríamos [0 .0189 .4145 .7945 .9838 .9931 1]. De esta manera se tiene un conjunto de n números donde n-2 de ellos son aleatorios y los otros dos están garantizados para ser 0 y 1. Me gustaría saber si el teorema del límite central todavía se aplica a los números generados de esta manera. Mediante una inspección visual con MATLAB, parece que se aproxima a la normalidad más rápidamente que cuando los números son todos aleatorios, pero me gustaría tener una razón matemática de por qué, especialmente teniendo en cuenta que el teorema del límite central establece que todos los números deben ser aleatorios.

2 votos

Tenga en cuenta que su $n-2$ los números aleatorios también son correlacionado y no necesariamente tienen distribuciones uniformes. Obsérvese también que cualquier constante puede verse como una variable aleatoria (cuyo valor es igual a esa constante en todas partes), así que eso no es un problema.

1 votos

Cuando dices "se aplica el teorema central del límite"... pero no está claro a qué lo quieres aplicar. Ten en cuenta que el teorema central del límite habla de la distribución de las medias estandarizadas cuando $\lim_{n\to\infty}$ no es algo que se pueda notar cuando $n=7$ . ¿Cuál es el proceso de limitación que está considerando?

0 votos

Sólo elegí n=7 como ejemplo para demostrar cómo estaba manipulando los datos, es decir, restando el mínimo y dividiendo por el nuevo máximo. Cuando digo "se aplica el teorema del límite central" estoy preguntando si el pdf converge a la normalidad con el aumento de n.

5voto

Jeff Bauer Puntos 236

Denote $X_i, i=1,...,n$ el $U(0,1)$ RVs independientes. La transformación descrita por la OP es (utilizando la notación habitual para las estadísticas de orden),

$$Z_i = \frac {X_i-X_{n,(1)}}{X_{n,(n)}-X_{n,(1)}} = R_n^{-1}\cdot (X_i-X_{n,(1)})$$

donde el doble índice en el estadístico de orden mínimo y máximo sirve para recordar que son funciones de $n$ . $R_n$ es el rango de la muestra sin transformar.

Queremos considerar

$$\frac 1n \sum_{i=1}^nZ_i \equiv \bar Z_n = R_n^{-1}\frac 1n \sum_{i=1}^nX_i - R_n^{-1}X_{n,(1)}$$

Tenemos que

$$R_n^{-1} \xrightarrow{p} 1,\;\;\; \frac 1n \sum_{i=1}^nX_i \xrightarrow{p} \frac 12,\;\; X_{n,(1)}\xrightarrow{p} 0$$

Así que en total, aplicando el lema de Slutsky,

$$\bar Z_n \xrightarrow{p} \frac 12 = \text{plim} \frac 1n \sum_{i=1}^nX_i \equiv \text{plim}\bar X_n$$

Así, la media muestral de la muestra transformada es también un estimador consistente del valor común esperado de la $X$ 's. Obsérvese que $\text{Var}(\bar X_n) = \frac 1{12n}$

A continuación, considere la manipulación

$$\sqrt{12n}\left(\bar Z_n - \frac 12\right) = \\R_n^{-1}\cdot \sqrt{12n}\left(\bar X_n - \frac 12 \right) +\sqrt{12n}\left(\frac 12R_n^{-1} -\frac 12\right) -\sqrt{12n}R_n^{-1}X_{n,(1)}$$

Examinamos cada uno de los tres componentes por separado:

A) Por el CLT tenemos que $\sqrt{12n}\left(\bar X_n - \frac 12 \right) \xrightarrow{d}\mathcal N (0,1)$ . Ya que también $R_n^{-1} \xrightarrow{p} 1$ entonces por Slutsky el primer término converge en la distribución a $\mathcal N (0,1)$ .

B) Podemos escribir

$$\sqrt{12n}\left(\frac 12R_n^{-1} -\frac 12\right) = \sqrt{3}\left(\frac {n(1-R_n)}{\sqrt nR_n}\right)$$

En Dasgupta 2008 ch. 8 p. 108 Ejemplo 8.12, se puede encontrar para el rango de la muestra de una muestra i.i.d. de $U(0,1)$ uniformes que $n(1-R_n) \xrightarrow{d} \frac 12 \mathcal \chi^2(4)$ ). Así que el numerador anterior converge mientras que el denominador va al infinito. Así que todo el término va a cero.

C) Sabemos que el estadístico de orden mínimo de una muestra de variables aleatorias no negativas, necesita ser escalado por $n$ para converger en la distribución ( ver este post ). En otras palabras, la convergencia es "rápida", y el escalamiento del tercer término sólo por $\sqrt n$ no es suficiente. Por lo tanto, tenemos que $\sqrt{12n}R_n^{-1}X_{n,(1)} \rightarrow0$ .

Por lo tanto, concluimos que

$$\sqrt{12n}\left(\bar Z_n - \frac 12\right) \xrightarrow{d} \mathcal N(0,1)$$

al igual que $\bar X_n$ para el mismo desplazamiento y escalado.

-2voto

Colin Wren Puntos 11

Digamos que su muestra es $(x_1, \ldots, x_n)$ , estás viendo la variable aleatoria

$$z = \frac{\bar{x} - \min_i x_i}{\max_i x_i - \min_i x_i}$$

En el caso de la distribución uniforme, $z$ converge casi con seguridad a $\bar{x}$ y como $\bar{x}$ converge en su distribución a una distribución normal, también lo hace $z$ .

1 votos

Supongamos en cambio que el $X_i$ eran exponenciales iid, desplazadas a la izquierda por $1$ para centrarlos en cero. Entonces el numerador de $z$ convergería a.s. a $1$ mientras que el denominador divergiría a.s., haciendo $z$ convergen a un constante $0$ en lugar de una distribución normal. Por tanto, parece que su razonamiento no es suficiente para demostrar la conclusión.

0 votos

Has dicho uniforme.

1 votos

Sólo me refiero a la lógica de tu respuesta, Arthur. Al aplicar exactamente su razonamiento a esta variable exponencial he obtenido una contradicción: la distribución de $z$ en el caso exponencial no pueden ser ambos $0$ y Normal (como tu post nos pide que creamos). Por lo tanto, aunque su conclusión es correcta, no puede serlo en virtud de las razones que ha ofrecido.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X