Tengo un problema con la prueba de
$E(Y|X) \in \arg \min_{g(X)} E\Big[\big(Y - g(X)\big)^2\Big]$
que muy probablemente revelan un malentendido más profundo de las expectativas y las expectativas condicionales.
La prueba que conozco es la siguiente ( se puede encontrar otra versión de esta prueba ici )
\begin{align*} &\arg \min_{g(X)} E\Big[\big(Y - g(x)\big)^2\Big]\\ = &\arg \min_{g(X)} E \Big[ \big(Y - E(Y|X) + E(Y|X) - g(X)\big)^2\Big]\\ =&\arg \min_{g(x)} E \Big[ \big(Y - E(Y|X)\big)^2 + 2 \big(Y - E(Y|X)\big) \big(E(Y|X) - g(X)\big) + \big(E(Y|X) - g(X)\big)^2\Big]\\ =&\arg \min_{g(x)} E \Big[ 2 \big(Y - E(Y|X)\big) \big(E(Y|X) - g(X)\big) + \big(E(Y|X) - g(X)\big)^2\Big]\\ \end{align*}
La prueba continúa con un argumento que muestra que $2 E\Big[ \big(Y - E(Y|X)\big) \big(E(Y|X) - g(X)\big)\Big] = 0$ y por lo tanto
\begin{align*} \arg \min_{g(x)} E\Big[\big(Y - g(x)\big)^2\Big] = \arg \min_{g(x)} E \Big[\big(E(Y|X) - g(X)\big)^2\Big] \end{align*}
que se puede ver minimizado cuando $g(X) = E(Y|X)$ .
Mis dudas sobre la prueba son las siguientes:
- Considere
$E \Big[ 2 \big(Y - E(Y|X)\big) \big(E(Y|X) - g(X)\big) + \big(E(Y|X) - g(X)\big)^2\Big]$ .
Me parece que, independientemente de cualquier argumento que demuestre que el primer término es siempre igual a cero, se puede ver que fijando $g(X) = E(Y|X)$ minimiza la expresión ya que implica $\big(E(Y|X) - g(X)\big) =0$ y por lo tanto
$E \Big[ 2 \big(Y - E(Y|X)\big) \big(E(Y|X) - g(X)\big) + \big(E(Y|X) - g(X)\big)^2\Big] = E( 0 + 0)$ = 0.
Pero si esto es cierto, entonces uno podría repetir la prueba sustituyendo $E(Y|X)$ por cualquier otra función de $X$ , digamos que $h(X)$ y llegar a la conclusión de que es $h(X)$ que minimiza la expresión. Así que debe haber algo que no entiendo (¿verdad?).
- Tengo algunas dudas sobre el significado de $E[(Yg(X))^2]$ en el planteamiento del problema. ¿Cómo debe interpretarse la notación? ¿Significa
$E_X[(Yg(X))^2]$ , $E_Y[(Yg(X))^2]$ o $E_{XY}[(Yg(X))^2]$ ?