Dado $-1\leq x_i\leq 1$ variables aleatorias idénticamente distribuidas para $i=1,2,\dots n$ . ¿Cuál es la función de distribución de su producto? ¿Existe un teorema del límite central para los productos si $n$ es grande?
Respuesta
¿Demasiados anuncios?La ampliación del CLT a los productos implicaría la $n^\text{th}$ raíz de $n$ variables. Esto plantea problemas cuando consideramos variables aleatorias que pueden ser negativas. Por lo tanto, consideremos las variables aleatorias $x_k\in[0,1]$ donde $P(x_k\lt a)=F(a)$ .
Dejemos que $u_k=\log(x_k)$ entonces $P(u_k\lt a)=F(e^a)$ .
La media de $u_k$ es $$ \begin{align} \mu &=-\int_{-\infty}^0F(e^a)\,\mathrm{d}a\\ &=-\int_0^1F(t)\frac{\mathrm{d}t}{t} \end{align} $$ y la varianza de $u_k$ es $$ \begin{align} \sigma^2 &=-2\int_{-\infty}^0aF(e^a)\,\mathrm{d}a-\left(\int_{-\infty}^0F(e^a)\,\mathrm{d}a\right)^2\\ &=-2\int_0^1F(t)\log(t)\frac{\mathrm{d}t}{t}-\left(\int_0^1F(t)\frac{\mathrm{d}t}{t}\right)^2 \end{align} $$ Por lo tanto, si $-\int_0^1F(t)\log(t)\frac{\mathrm{d}t}{t}\lt\infty$ La norma CLT se aplica a $\log(x_k)$ y el $n^\text{th}$ raíz del producto de $n$ variables tiende a $$ e^{-\int_0^1F(t)\frac{\mathrm{d}t}{t}} $$ Así, el producto de $x_k$ se aproxima a un distribución logarítmica normal donde el logaritmo del producto tiene media $n\mu$ y la varianza $n\sigma^2$ . Es decir, la distribución de la $n^\text{th}$ raíz del producto de $n$ variables se aproxima $$ \frac{\sqrt{n}}{x\sigma\sqrt{2\pi}}e^{-\frac{n}{2}\left(\frac{\log(x)-\mu}{\sigma}\right)^2} $$ que tiende a un delta de Dirac en $x=e^\mu$ .
La distribución del logaritmo del producto de $n$ de la $x_k$ será el $n$ -convolución doble de la distribución de $\log(x_k)$ que es $e^aF'(e^a)$ . La distribución acumulativa del logaritmo del producto de $n$ de la $x_k$ es entonces $$ F_n(e^a)=\overbrace{e^aF'(e^a)\ast e^aF'(e^a)\ast\dots\ast e^aF'(e^a)}^{n-1\text{ terms}}\ast F(e^a) $$ La distribución del producto de $n$ de la $x_k$ es entonces $F_n'$
Ejemplo 1: Para una distribución uniforme en $[0,1]$ tenemos $F(t)=t$ y el $n^\text{th}$ raíz del producto de $n$ variables tiende a $e^{-1}$ .
La distribución de la $n^\text{th}$ raíz del producto de $n$ uniforme $[0,1]$ variables se aproxima $$ \frac{\sqrt{n}}{x\sqrt{2\pi}}e^{-\frac{n}{2}(\log(x)+1)^2} $$ que tiende a un Delta Diract en $x=e^{-1}$ .
$\hspace{4mm}$
Ejemplo 2: Para calcular la distribución del producto de dos variables, tenemos que considerar $F$ en un ámbito más amplio: $$ F(t)=\left\{\begin{array}{l} 0&\text{if }t\lt0\\ t&\text{if }0\le t\le1\\ 1&\text{if }t\gt1 \end{array}\right. $$
calculamos la convolución $$ F_2(e^a)=e^aF'(e^a)\ast F(e^a)=(1-a)e^a $$ Por lo tanto, la distribución acumulativa es $$ F_2(t)=(1-\log(t))t $$ y la distribución del producto de dos reales uniformemente distribuidos en $[0,1]$ es $$ F_2'(t)=-\log(t) $$