6 votos

Normalización a distribución no degenerada

Estoy leyendo la Teoría del Valor Extremo de de Haan (2006). En la discusión de la distribución del máximo muestral, dice que "para obtener una distribución límite no degenerada, es necesaria una normalización". Luego dio el siguiente ejemplo. "Supongamos que existe una secuencia de constantes $(a_n)>0$ y $(b_n)$ tal que

\begin{equation} \frac{\max \{X_1, \cdots, X_n\} - b_n}{a_n} (1) \end{equation}

tiene una distribución límite no degenerada como $n \to \infty$ es decir, $$\lim_n F^n(a_nx + b_n)=G(x), (2)$$ para cada punto de continuidad $x$ de $G$ donde $G$ es una función de distribución no degenerada". Y también comentó que se trata de una normalización lineal.

Tengo tres preguntas.

  1. ¿Qué significa normalizar a una función de distribución no degenerada, por favor? En mis estudios anteriores, normalización significa encontrar la constante $c=\frac{1}{\sqrt{2\pi}}$ tal que $\int_\mathbb R c e^{-\frac{x^2}{2}} = 1$ . Parece que normalización significa cosas diferentes en el libro de De Haan.
  2. ¿Qué hacen las dos secuencias $(a_n)$ y $(b_n)$ ¿Quieres decir aquí, por favor? ¿O qué papel desempeñan, por favor? ¿Por qué $(1)$ equivalente a $(2)$ ¿Por favor?
  3. ¿Cuáles son las normalizaciones no lineales más comunes? Gracias.

10voto

Jeff Bauer Puntos 236

Consideremos el ejemplo más básico, la media muestral de una muestra i.i.d. de tamaño $n$ , $\bar X_n$ .

Sabemos que como $n \rightarrow \infty$ , $\bar X_n \rightarrow \mu$ donde $\mu$ es la media común, el valor esperado, de las variables aleatorias a partir de las cuales se genera la muestra.

Así que al límite, $\bar X$ tiene un degenerado que es la manera formal de decir que converge a una constante. Los términos constantes pueden considerarse como degenerado variables aleatorias. Solemos decir que "las constantes no tienen distribución", pero como a veces las cuestiones de existencia (lo que significa que la frase "la distribución no existe" significa correctamente que la estadística que examinamos va al infinito a medida que el tamaño de la muestra va al infinito), la forma correcta de distinguir los dos casos es decir "la distribución de una constante es degenerada".

¿Y qué hacemos para obtener una distribución asintótica no degenerada? Creamos una función de la media muestral, que no converge a una constante, pero tampoco diverge. En el caso de la media muestral, esta función es $\sqrt n(\bar X_n -\mu)$ .

Con un espíritu análogo, en la Teoría del Valor Extremo, los estadísticos de orden extremo, o bien divergen (si la distribución tiene soporte no acotado), o bien tienden a una constante (si la distribución tiene soporte acotado por su parte). En ambos casos, no obtenemos una distribución límite. Así que tenemos que encontrar una función del estadístico de orden extremo, que convergerá a una variable aleatoria no constante y por lo tanto, con una distribución utilizable. Las secuencias deterministas $\{a_n\}$ y $\{b_n\}$ junto con la estadística, crean esta función. Encontrar estas secuencias no es tan sencillo, véase por ejemplo este puesto.

En cuanto al ejemplo dado por @Glen_b para el estadístico de orden máximo a partir de un Uniforme $U(0,1)$ (una distribución con soporte acotado), intuitivamente, al aumentar el tamaño de la muestra, obtendremos al menos un realización de la variable aleatoria que es exactamente igual a su límite superior. Pero esto significa que $X_{(n)} \rightarrow \max X$ que es una constante, por lo que tiene una distribución degenerada. Así que tenemos que encontrar una función de $X_{(n)}$ que no diverge y sí converge a una variable aleatoria. En el caso concreto, esta función es efectivamente $Z = n(1-X_{(n)})$ . Para ver esto, utilice la fórmula de cambio de variable para encontrar que

$$Z =n(1-X_{(n)}) \Rightarrow X_{(n)} = 1-\frac Zn \Rightarrow \left|\frac {\partial X}{\partial Z} \right|= \frac 1n$$

y observe que $Z \in [0,n]$ . Por lo tanto

$$f_Z(z) = \left|\frac {\partial X}{\partial Z} \right| f_{X_{(n)}}(1-z/n) = \frac 1n \left (nf_X(1-z/n)[F_X(1-z/n)]^{n-1}\right)$$

Pero $f_X(\cdot) =1$ y $F_X(x) =x$ . Así que

$$f_Z(z) =\left(1-\frac zn\right)^{n-1}$$

y

$$F_Z(z) = \int_{0}^z\left(1-\frac tn\right)^{n-1}dt = 1-\left(1-\frac zn\right)^{n}$$

Entonces

$$\lim_{n\rightarrow \infty}F_Z(z) = 1-\lim_{n\rightarrow \infty}\left(1-\frac zn\right)^{n} = 1-e^{-z}$$

que es la función de distribución de una exponencial estándar (es decir, con valor medio $1$ ).

3voto

AdamSane Puntos 1825

Normalización se utiliza para referirse a una variedad de cosas - que por lo general se refieren a la escala de alguna manera. En este caso, se trata simplemente de encontrar constantes por las que restar y dividir de forma que la secuencia resultante de variables aleatorias converja a una distribución que no sea degenerada.

Presumiblemente en la situación que nos ocupa,

\begin{equation} \max \{X_1, \cdots, X_n\} \end{equation}

es degenerado (suele ser el caso).

Aparte de algunas rarezas en el sentido de que parecen estar utilizando una letra para dos cosas diferentes allí, todo lo que están hablando es de elegir $a_n$ y $b_n$ para que

\begin{equation} \frac{\max \{X_1, \cdots, X_n\} - b_n}{a_n} \end{equation}

no es degeneran en el límite.

Si puede encontrar $E(\max \{X_1, \cdots, X_n\})$ y $\text{Var}(\max \{X_1, \cdots, X_n\})$ como funciones de $n$ por ejemplo, podría establecer $b_n$ a la primera y $a_n$ a la raíz cuadrada del segundo, lo que produciría algo que tiene media y varianza constantes ( $0$ y $1$ respectivamente). Si la distribución converge en el límite, debe satisfacer las condiciones.


Por ejemplo $X_i$ siendo U(0,1). Entonces, en el límite, el máximo muestral $X_{(n)}$ es degenerada.

Pero creo que $n(1-X_{(n)})$ no es degenerada en el límite - IIRC va a una exponencial estándar.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X