Este post profundiza en las respuestas de los comentarios a la pregunta.
Sea $X = (X_1, X_2, \ldots, X_n)$ . Arreglar cualquier $\mathbf{e}_1\in\mathbb{R}^n$ de longitud unitaria. Un vector de este tipo siempre puede completarse en una base ortonormal $(\mathbf{e}_1, \mathbf{e}_2, \ldots, \mathbf{e}_n)$ (mediante el Proceso Gram-Schmidt por ejemplo). Este cambio de base (respecto a la habitual) es ortogonal: no cambia las longitudes. Por tanto, la distribución de
$$\frac{(\mathbf{e}_1\cdot X)^2}{||X||^2}=\frac{(\mathbf{e}_1\cdot X)^2}{X_1^2 + X_2^2 + \cdots + X_n^2} $$
no depende de $\mathbf{e}_1$ . Tomando $\mathbf{e}_1 = (1,0,0,\ldots, 0)$ muestra que tiene la misma distribución que
$$\frac{X_1^2}{X_1^2 + X_2^2 + \cdots + X_n^2}.\tag{1} $$
Desde el $X_i$ son iid Normal, pueden escribirse como $\sigma$ veces iid estándar Variables normales $Y_1, \ldots, Y_n$ y sus cuadrados son $\sigma^2$ veces $\Gamma(1/2)$ distribuciones. Dado que la suma de $n-1$ independiente $\Gamma(1/2)$ distribuciones es $\Gamma((n-1)/2)$ hemos determinado que la distribución de $(1)$ es la de
$$\frac{\sigma^2 U}{\sigma^2 U + \sigma^2 V} = \frac{U}{U+V}$$
donde $U = X_1^2/\sigma^2 \sim \Gamma(1/2)$ y $V = (X_2^2 + \cdots + X_n^2)/\sigma^2 \sim \Gamma((n-1)/2)$ son independientes. Es bien conocido que este ratio tiene una Beta $(1/2, (n-1)/2)$ distribución. (Véase también el hilo estrechamente relacionado en Distribución de $XY$ si $X \sim$ Beta $(1,K-1)$ y $Y \sim$ chi-cuadrado con $2K$ grados .)
Desde $$X_1 + \cdots + X_n = (1,1,\ldots,1)\cdot (X_1, X_2, \cdots, X_n) = \sqrt{n}\,\mathbf{e}_1\cdot X$$
para el vector unitario $\mathbf{e}_1=(1,1,\ldots,1)/\sqrt{n}$ concluimos que $Z$ es $(\sqrt{n})^2 = n$ veces un Beta $(1/2, (n-1)/2)$ variar. Para $n\ge 2$ por lo que tiene función de densidad
$$f_Z(z) = \frac{n^{1-n/2}}{B\left(\frac{1}{2}, \frac{n-1}{2}\right)} \sqrt{\frac{(n-z)^{n-3}}{z}}$$
en el intervalo $(0,n)$ (y en caso contrario es cero).
Como comprobación, he simulado $100,000$ realizaciones independientes de $Z$ para $\sigma=1$ y $n=2,3,10$ se han trazado sus histogramas y se ha superpuesto el gráfico de la densidad Beta correspondiente (en rojo). Las concordancias son excelentes.
Aquí está el R
código. Realiza la simulación mediante la fórmula sum(x)^2 / sum(x^2)
para $Z$ donde x
es un vector de longitud n
generado por rnorm
. El resto son bucles ( for
, apply
) y el trazado ( hist
, curve
).
for (n in c(2, 3, 10)) {
z <- apply(matrix(rnorm(n*1e5), nrow=n), 2, function(x) sum(x)^2 / sum(x^2))
hist(z, freq=FALSE, breaks=seq(0, n, length.out=50), main=paste("n =", n), xlab="Z")
curve(dbeta(x/n, 1/2, (n-1)/2)/n, add=TRUE, col="Red", lwd=2)
}