Sea $X_1,\ldots,X_n$ sean variables aleatorias, cada una con una expectativa $\mu_{1},\ldots,\mu_{n}$ . Además $\pi$ sea una RV que toma valores en $\left\{1,\ldots,n\right\}$ . En la literatura sobre aprendizaje automático, se afirma que $\mathbb{E}[X_{\pi}]=\mathbb{E}[\mu_{\pi}]$ . ¿Es cierto?
Sé que por la propiedad de la torre, se mantiene $\mathbb{E}[X_{\pi}]=\mathbb{E}[\mathbb{E}[X_{\pi}|\pi]]$ donde $\mathbb{E}[X_{\pi}|\pi]$ es la expectativa condicional de $X_{\pi}$ en relación con el $\sigma$ -generada por $\pi$ . La intuición dice que $\mathbb{E}[X_{\pi}|\pi]=\mu_{\pi}$ desde $X_{\pi}$ se convierte en un VR con índice determinista al conocer $\pi$ .
Sin embargo, no consigo demostrar que $\mathbb{E}[\mathbb{I}_{\left\{\pi=k\right\}}\mu_{\pi}]=\mathbb{E}[\mathbb{I}_{\left\{\pi=k\right\}}X_{\pi}]$ , $\forall k\in [n]$ y, por lo tanto $\mu_{\pi}$ es la versión de $\mathbb{E}[X_{\pi}|\pi]$ .
Gracias de antemano por su ayuda.