16 votos

Distribución de la relación de variables aleatorias chi-cuadrado dependientes

Supongamos que $ X = X_1 + X_2+\cdots+ X_n $ donde $X_i \sim N(0,\sigma^2)$ son independientes.

Mi pregunta es, ¿qué distribución

$$ Z = \frac{X^2}{X_1^2 + X_2^2 + \cdots + X_n^2}$$

¿seguir? Sé por aquí que el cociente de dos variables aleatorias chi-cuadrado expresadas como $\frac{W}{W + Y}$ sigue una distribución Beta. Creo que esto supone la independencia entre $W$ y $Y$ . Sin embargo, en mi caso, el denominador de $Z$ contiene los componentes de $X$ al cuadrado.

Creo que $Z$ también debe seguir una variación de la distribución Beta, pero no estoy seguro. Y si esta suposición es correcta, no sé cómo demostrarlo.

10voto

jldugger Puntos 7490

Este post profundiza en las respuestas de los comentarios a la pregunta.


Sea $X = (X_1, X_2, \ldots, X_n)$ . Arreglar cualquier $\mathbf{e}_1\in\mathbb{R}^n$ de longitud unitaria. Un vector de este tipo siempre puede completarse en una base ortonormal $(\mathbf{e}_1, \mathbf{e}_2, \ldots, \mathbf{e}_n)$ (mediante el Proceso Gram-Schmidt por ejemplo). Este cambio de base (respecto a la habitual) es ortogonal: no cambia las longitudes. Por tanto, la distribución de

$$\frac{(\mathbf{e}_1\cdot X)^2}{||X||^2}=\frac{(\mathbf{e}_1\cdot X)^2}{X_1^2 + X_2^2 + \cdots + X_n^2} $$

no depende de $\mathbf{e}_1$ . Tomando $\mathbf{e}_1 = (1,0,0,\ldots, 0)$ muestra que tiene la misma distribución que

$$\frac{X_1^2}{X_1^2 + X_2^2 + \cdots + X_n^2}.\tag{1} $$

Desde el $X_i$ son iid Normal, pueden escribirse como $\sigma$ veces iid estándar Variables normales $Y_1, \ldots, Y_n$ y sus cuadrados son $\sigma^2$ veces $\Gamma(1/2)$ distribuciones. Dado que la suma de $n-1$ independiente $\Gamma(1/2)$ distribuciones es $\Gamma((n-1)/2)$ hemos determinado que la distribución de $(1)$ es la de

$$\frac{\sigma^2 U}{\sigma^2 U + \sigma^2 V} = \frac{U}{U+V}$$

donde $U = X_1^2/\sigma^2 \sim \Gamma(1/2)$ y $V = (X_2^2 + \cdots + X_n^2)/\sigma^2 \sim \Gamma((n-1)/2)$ son independientes. Es bien conocido que este ratio tiene una Beta $(1/2, (n-1)/2)$ distribución. (Véase también el hilo estrechamente relacionado en Distribución de $XY$ si $X \sim$ Beta $(1,K-1)$ y $Y \sim$ chi-cuadrado con $2K$ grados .)

Desde $$X_1 + \cdots + X_n = (1,1,\ldots,1)\cdot (X_1, X_2, \cdots, X_n) = \sqrt{n}\,\mathbf{e}_1\cdot X$$

para el vector unitario $\mathbf{e}_1=(1,1,\ldots,1)/\sqrt{n}$ concluimos que $Z$ es $(\sqrt{n})^2 = n$ veces un Beta $(1/2, (n-1)/2)$ variar. Para $n\ge 2$ por lo que tiene función de densidad

$$f_Z(z) = \frac{n^{1-n/2}}{B\left(\frac{1}{2}, \frac{n-1}{2}\right)} \sqrt{\frac{(n-z)^{n-3}}{z}}$$

en el intervalo $(0,n)$ (y en caso contrario es cero).


Como comprobación, he simulado $100,000$ realizaciones independientes de $Z$ para $\sigma=1$ y $n=2,3,10$ se han trazado sus histogramas y se ha superpuesto el gráfico de la densidad Beta correspondiente (en rojo). Las concordancias son excelentes.

Figure

Aquí está el R código. Realiza la simulación mediante la fórmula sum(x)^2 / sum(x^2) para $Z$ donde x es un vector de longitud n generado por rnorm . El resto son bucles ( for , apply ) y el trazado ( hist , curve ).

for (n in c(2, 3, 10)) {
  z <- apply(matrix(rnorm(n*1e5), nrow=n), 2, function(x) sum(x)^2 / sum(x^2))
  hist(z, freq=FALSE, breaks=seq(0, n, length.out=50), main=paste("n =", n), xlab="Z")
  curve(dbeta(x/n, 1/2, (n-1)/2)/n, add=TRUE, col="Red", lwd=2)
}

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X