6 votos

¿Hay estadística de la orden de una variable gaussiana elevada a una potencia?

Que $X$ sea una variable aleatoria con una distribución normal estándar. Que $Y = |X|^{2p}$. Estoy tratando de encontrar la distribución $Y_{(n)}$, es decir, el mayor valor de $Y$ $n$ muestras.

He derivado el pdf que: $$f_{Y_{(n)}} = n \left(\frac{1}{p\sqrt{2\pi}} y^{\frac{1}{2p} - 1} \exp\left(-\frac{1}{2}y^{1/p} \right)\right) \left(\int_0^y \frac{1}{p\sqrt{2\pi}} t^{\frac{1}{2p} - 1} \exp\left(-\frac{1}{2}t^{1/p}\right) \, dt \right)^{n-1}$ $

Pero Mathematica dice $EY_{(n)}$ es infinito. Intuitivamente, me parece que sea un valor finito en términos de p y n. ¿Alguna idea?

3voto

Will Green Puntos 758

Deje $Z \sim N(0,1)$. A continuación, $X = |Z|$ tiene una media de la distribución Normal con pdf $f(x)$:

Deje ${X_1, \dots, X_n}$ denotan una muestra aleatoria de tamaño $n$ dibujado en $X$, y deje $X_{(n)}$ denotar el ejemplo máximo. El pdf de $X_{(n)}$, decir $g(x)$ es fácil derivar con un sistema de álgebra computacional:

con el dominio de apoyo a $X>0$.

Deje $Y = X^\alpha$ donde $\alpha >1$. Desde $X > 0$, se deduce que el $Y_{(n)} = {X_{(n)}}^\alpha$.

El pdf de $Y_{(n)}$, decir $h(y)$, es el dado por la transformación:

definido en el real positiva de la línea. Todo hecho.

En el siguiente diagrama se traza el pdf de $Y_{(n)}$ al $\alpha = 2$, para diferentes tamaños de muestra $n$:

Monte Carlo de verificación

Aquí hay una guía rápida de Monte Carlo de verificación. En el siguiente:

  • el azul de garabatos de la curva indica que la simulación empírica pdf de la muestra (máximo) $Y_{(n)}$

  • el rojo discontinuo de la curva de parcelas el teórico exacto pdf de $Y_{(n)}$ derivados de arriba

al$\alpha = 2$$n = 10$:

Se ve bien.

Notas

  1. Erf denota la: función de Error

  2. El OrderStat y Transform funciones utilizadas anteriormente son de la mathStatica suite para Mathematica. Como la divulgación, debo añadir que yo soy uno de los autores.

1voto

BruceET Puntos 7117

Comentario:

Tratando de visualizar lo que podría estar pasando mal, me simulado esta en el R de 100.000 muestras de tamaño $n = 5$ $p = 1.5.$ la simulación de La distribución de $Y_{(5)}$ (a la izquierda de la trama) es extremadamente sesgada de derecha, incluso para pequeñas $p$, lo que puede estar causando algunos problemas en Mathematica. Sin embargo, varias pistas dio casi los mismos valores de $E(Y)$ y $SD(Y)$ cada vez, lo que sugiere que los verdaderos valores son finitos. Un histograma (a la derecha) muestra la distribución de las $\log(Y_{(5)})$.

 B = 10^5; p = 1.5; n = 5
 y = abs(rnorm(B*n))^(2*p)
 DTA = matrix(y, nrow=B)  # B x n: each row a sample of n
 y.5 = apply(DTA, 1, max) # vector of B sample maxima
 mean(y.5);  sd(y.5)
 ## 5.437638  # approx E(Y.5)
 ## 6.134618  # approx SD(Y.5)

enter image description here

Ref: Fragmentaria, como es, la página de Wikipedia sobre "doblado distribución normal' puede ser de alguna ayuda.

0voto

Marc Puntos 3385

En esta respuesta voy a tratar de derivar una fórmula analítica para usted. Creo que mi respuesta es la misma que la suya. De todos modos, se puede utilizar para comparar su resultado y comprobar lo que podría haber salido mal.

Deje $\Phi$ denota la función de distribución acumulativa de la distribución normal estándar. Que es $$ \Phi(x) = \int_{-\infty}^{x}\frac{1}{\sqrt{2\pi}}e^{-t^2/2}dt $$ En el siguiente vamos a la $X_i$ estándar de la distribución normal y $Y_i = |X_i|^{2p}$. Entonces $$ P(Y_{(n)}\le y) = P(Y_1\le y;\cdots;Y_n\le y) = \prod_{i=1}^{n}P(Y_i\le y) =: F_Y(y)^n $$ y así $$ f_{Y_{(n)}}(y) = \frac{d}{dy}F_Y(y)^n = nF_Y(y)^{n-1}f_Y(y). $$ Llegamos a la conclusión de que si se puede determinar $F_Y(y)$, luego tenemos el pdf de $Y_{(n)}$. $$ F_Y(y) = P(Y\le y) = P(|X|^{2}\le y) = P(-y^{1/2p}\le X \le y^{1/2p}) = 2\Phi(y^{1/2p})-1 $$ De esto podemos ver que $$ f_Y(y) = \frac{d}{dy}2\Phi(y^{1/2p})-1 = 2f_X(y^{1/2p})\frac{1}{2}y^{-\frac{2p-1}{2}}. $$ Finalmente obtenemos que \begin{align} f_{Y_{(n)}}(y) &= n\left(2\Phi(y^{1/2p})-1\right)^{n-1}2f_X(y^{1/2p})\frac{1}{2p}y^{-\frac{2p-1}{2p}}\\ &= n\left(2\int_{-\infty}^{y^{1/2p}}\frac{1}{\sqrt{2\pi}}e^{-t^2/2}dt-1\right)^{n-1}\left(\frac{1}{\sqrt{2\pi}}e^{-y^{1/p}/2}\right)\frac{1}{p}y^{-\frac{2p-1}{2p}} \end{align}

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X