29 votos

Teoría del Valor Extremo - Mostrar: Normal a Gumbel

El máximo de $X_1,\dots,X_n. \sim$ i.i.d. Las normales convergen a la Gumbel estándar Distribución según Teoría del valor extremo .

¿Cómo podemos demostrarlo?

Tenemos

$$P(\max X_i \leq x) = P(X_1 \leq x, \dots, X_n \leq x) = P(X_1 \leq x) \cdots P(X_n \leq x) = F(x)^n $$

Tenemos que encontrar/elegir $a_n>0,b_n\in\mathbb{R}$ secuencias de constantes tales que: $$F\left(a_n x+b_n\right)^n\rightarrow^{n\rightarrow\infty} G(x) = e^{-\exp(-x)}$$

¿Puede resolverlo o encontrarlo en la literatura?

Hay algunos ejemplos pg.6/71 pero no para el caso normal:

$$\Phi\left(a_n x+b_n\right)^n=\left(\frac{1}{\sqrt{2\pi}}\int_{-\infty}^{a_n x+b_n} e^{-\frac{y^2}{2}}dy\right)^n\rightarrow e^{-\exp(-x)}$$

33voto

Jeff Bauer Puntos 236

Una forma indirecta, es la siguiente:
Para distribuciones absolutamente continuas, Richard von Mises (en un artículo de 1936 "La distribución del mayor de los valores n que parece haber sido reproducido -en inglés - en una edición de 1964 con trabajos suyos seleccionados), ha aportado lo siguiente suficiente condición para que el máximo de una muestra converja al Gumbel estándar, $G(x)$ :

Dejemos que $F(x)$ sea la función de distribución común de $n$ variables aleatorias i.i.d., y $f(x)$ su densidad común. Entonces, si

$$\lim_{x\rightarrow F^{-1}(1)}\left (\frac d{dx}\frac {(1-F(x))}{f(x)}\right) =0 \Rightarrow X_{(n)} \xrightarrow{d} G(x)$$

Utilizando la notación habitual para la normal estándar y calculando la derivada, tenemos

$$\frac d{dx}\frac {(1-\Phi(x))}{\phi(x)} = \frac {-\phi(x)^2-\phi'(x)(1-\Phi(x))}{\phi(x)^2} = \frac {-\phi'(x)}{\phi(x)}\frac {(1-\Phi(x))}{\phi(x)}-1$$

Tenga en cuenta que $\frac {-\phi'(x)}{\phi(x)} =x$ . Además, para la distribución normal, $F^{-1}(1) = \infty$ . Así que tenemos que evaluar el límite

$$\lim_{x\rightarrow \infty}\left (x\frac {(1-\Phi(x))}{\phi(x)}-1\right) $$

Pero $\frac {(1-\Phi(x))}{\phi(x)}$ es la razón de Mill, y sabemos que la razón de Mill para la normal estándar tiende a $1/x$ como $x$ crece. Así que

$$\lim_{x\rightarrow \infty}\left (x\frac {(1-\Phi(x))}{\phi(x)}-1\right) = x\frac {1}{x}-1= 0$$

y se cumple la condición suficiente.

Las series asociadas se dan como $$a_n = \frac 1{n\phi(b_n)},\;\;\; b_n = \Phi^{-1}(1-1/n)$$

ADDENDUM

Esto es del capítulo 10.5 del libro H.A. David & H.N. Nagaraja (2003), "Order Statistics" (3ª edición) .

$\xi_a = F^{-1}(a)$ . Además, la referencia a de Haan es " Haan, L. D. (1976). Sample extremes: an elementary introduction. Statistica Neerlandica, 30(4), 161-172. " Pero cuidado, porque algunas de las anotaciones tienen un contenido diferente en de Haan -por ejemplo en el libro $f(t)$ es la función de densidad de probabilidad, mientras que en de Haan $f(t)$ significa que la función $w(t)$ del libro (es decir, la ratio de Mill). Además, de Haan examina la condición suficiente ya diferenciada.

enter image description here

21voto

jldugger Puntos 7490

La pregunta plantea dos cosas: (1) cómo demostrar que el máximo $X_{(n)}$ converge, en el sentido de que $(X_{(n)}-b_n)/a_n$ converge (en la distribución) para secuencias convenientemente elegidas $(a_n)$ y $(b_n)$ a la distribución estándar de Gumbel y (2) cómo encontrar dichas secuencias.

La primera es bien conocida y está documentada en los documentos originales sobre el teorema de Fisher-Tippett-Gnedenko (FTG). La segunda parece ser más difícil; esa es la cuestión que se aborda aquí.

Por favor, para aclarar algunas afirmaciones que aparecen en otras partes de este hilo, que

  1. El máximo hace no convergen a nada: divergen (aunque muy lentamente).

  2. Parece que hay diferentes convenciones sobre la distribución de Gumbel. Adoptaré la convención de que la FCD de un invertido La distribución de Gumbel viene dada, hasta la escala y la ubicación, por $1-\exp(-\exp(x))$ . Un máximo convenientemente estandarizado de variantes normales iid converge a una distribución de Gumbel invertida.


Intuición

Cuando el $X_i$ son iid con función de distribución común $F$ la distribución del máximo $X_{(n)}$ es

$$F_n(x) = \Pr(X_{(n)}\le x) = \Pr(X_1 \le x)\Pr(X_2 \le x) \cdots \Pr(X_n \le x) = F^n(x).$$

Cuando el apoyo de $F$ no tiene límite superior, ya que con una distribución Normal, la secuencia de funciones $F^n$ marcha siempre hacia la derecha sin límite:

Figure 1

Gráficos parciales de $F_n$ para $n=1,2,2^2, 2^4, 2^8, 2^{16}$ se muestran.

Para estudiar la formas de estas distribuciones, podemos desplazar cada una de ellas hacia la izquierda en alguna cantidad $b_n$ y lo reescalamos por $a_n$ para que sean comparables.

Figure 2

Cada uno de los gráficos anteriores se ha desplazado para situar su mediana en $0$ y hacer su rango intercuartil de longitud unitaria.

FTG afirma que las secuencias $(a_n)$ y $(b_n)$ puede elegirse de forma que estas funciones de distribución converjan puntualmente en cada $x$ a algunos distribución de valores extremos , hasta la escala y la ubicación. Cuando $F$ es una distribución Normal, la distribución particular de valores extremos limitantes es una Gumbel invertida, hasta la localización y la escala.


Solución

Es tentador emular el Teorema Central del Límite normalizando $F_n$ para tener media y varianza unitarias. Sin embargo, esto es inapropiado, en parte porque la FTG se aplica incluso a las distribuciones (continuas) que no tienen primer o segundo momento. En su lugar, utilizar un percentil (como la mediana) para determinar la ubicación y una diferencia de percentiles (como el IQR) para determinar la dispersión. (Este enfoque general debería conseguir encontrar $a_n$ y $b_n$ para tout distribución continua).

Para la distribución normal estándar, esto resulta fácil. Sea $0 \lt q \lt 1$ . Un cuantil de $F_n$ correspondiente a $q$ es cualquier valor $x_q$ para lo cual $F_n(x_q) = q$ . Recordando la definición de $F_n(x) = F^n(x)$ la solución es

$$x_{q;n} = F^{-1}(q^{1/n}).$$

Por lo tanto, podemos establecer

$$b_n = x_{1/2;n},\ a_n = x_{3/4;n} - x_{1/4;n};\ G_n(x) = F_n(a_n x + b_n).$$

Porque, por construcción, la mediana de $G_n$ es $0$ y su IQR es $1$ la mediana del valor límite de $G_n$ (que es una versión de Gumbel invertido) debe ser $0$ y su IQR debe ser $1$ . Sea el parámetro de escala $\beta$ y el parámetro de ubicación sea $\alpha$ . Dado que la mediana es $\alpha + \beta \log\log(2)$ y el IQR se encuentra fácilmente para ser $\beta(\log\log(4) - \log\log(4/3))$ los parámetros deben ser

$$\alpha = \frac{\log\log 2}{\log\log(4/3) - \log\log(4)};\ \beta = \frac{1}{\log\log(4) - \log\log(4/3)}.$$

No es necesario que $a_n$ y $b_n$ para ser exactamente estos valores: sólo tienen que aproximarse a ellos, siempre que el límite de $G_n$ sigue siendo esta distribución de Gumbel invertida. Un análisis sencillo (pero tedioso) para una normal estándar $F$ indica que las aproximaciones

$$a_n^\prime = \frac{\log \left(\left(4 \log^2(2)\right)/\left(\log^2\left(\frac{4}{3}\right)\right)\right)}{2\sqrt{2\log (n)}},\ b_n^\prime = \sqrt{2\log (n)}-\frac{\log (\log (n))+\log \left(4 \pi \log ^2(2)\right)}{2 \sqrt{2\log (n)}}$$

funcionará bien (y es lo más sencillo posible).

Figure 3

Las curvas azul claro son gráficos parciales de $G_n$ para $n=2, 2^6, 2^{11}, 2^{16}$ utilizando las secuencias aproximadas $a_n^\prime$ y $b_n^\prime$ . La línea roja oscura representa la distribución de Gumbel invertida con parámetros $\alpha$ y $\beta$ . La convergencia es clara (aunque la tasa de convergencia para los negativos $x$ es notablemente más lento).


Referencias

B. V. Gnedenko, Sobre la distribución límite del término máximo en una serie aleatoria . En Kotz y Johnson, Avances en Estadística Volumen I: Fundamentos y teoría básica, Springer, 1992. Traducido por Norman Johnson.

2voto

user53211 Puntos 11

Este es un enfoque "directo". Deje que $a_n > 0$ , $b_n$ a determinar para que $a_nx+b_n \rightarrow +\infty$ para todos $x$ .

De la regla de L'Hospital, $$ \underset{A \rightarrow \infty }{lim} \frac{\int_A^{+\infty} e^{-u^2/2} du}{A^p e^{-A^2/2}} = 1 $$ cuando $p=-1$ por lo que tenemos: $$ F(a_n x + b_n) = 1 - \frac{1}{\sqrt{2\pi}}\, \frac{e^{-(a_nx+b_n)^2/2}}{(a_nx+b_n)}(1+o(1)) $$ donde $o(1) \rightarrow 0$ bajo la hipótesis de funcionamiento en $a_n, b_n$ .

Entonces $$ \begin{align*} ln\!\left(\ F(a_n x + b_n)^n \right) &= n\, ln\!\left( 1 - \frac{1}{\sqrt{2\pi}}\, \frac{e^{-(a_nx+b_n)^2/2}}{(a_nx+b_n)}(1+o(1))\right) \\ & = - \frac{n}{\sqrt{2\pi}}\, \frac{e^{-(a_nx+b_n)^2/2}}{(a_nx+b_n)}(1+o(1)) \\ & = - \frac{n}{\sqrt{2\pi}}\, \frac{e^{-a_n^2x^2/2-b_n^2/2 - a_nb_nx}}{(a_nx+b_n)}(1+o(1)) \end{align*} $$ Si tomamos $a_n = 1/b_n \rightarrow 0^+$ la suposición requerida $a_nx+b_n \rightarrow +\infty$ para todos $x$ se satisface, y:

$$ \begin{align*} ln\!\left(\ F(a_n x + b_n)^n \right) &= - \frac{n}{\sqrt{2\pi}\, b_n \,e^{b_n^2/2} }\, e^{-x}(1+o(1)) \end{align*} $$

Ahora sólo queda demostrar que se puede elegir $b_n$ para que $$ b_n \,e^{b_n^2/2} ~=~ \frac{n}{\sqrt{2\pi}}(1+o(1)) \ \ , $$ que es claramente factible.

Resolver esta ecuación "asintóticamente" es divertido. Obviamente el gran factor de la izquierda es $e^{b_n^2/2}$ lo que sugiere que $b_n \approx \sqrt{2\,ln(n)}$ . Después de algunas pruebas y errores, una posible solución explícita es:

$$ b_n = \sqrt{ ln\!\left( \frac{n^2}{4\pi\, ln(n)} \right) } = \sqrt{2 ln(n) \left( 1 - \frac{ln(4\pi\,ln(n))}{2\, ln(n)} \right)} $$

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X