Tengo una variable $X\in R^2$ que tiene una distribución normal bivariada con el vector de la media $\mu$ y la matriz de covarianza $\Sigma$ .
El vector $X$ se compone de dos variables $X=(x_1,x_2)$
Una función $f$ es una función de $x_1$ sólo
$f(x_1) = \left\{\begin{array}{lr} 0 & \text{for } x_1 < 0\\ x_1 & \text{for } x_1 \geq 0\\ \end{array} \right\} $
Ya calculé que la media de $f(x_1)$ es $\frac{\sigma_{11}}{\sqrt{2\pi}}$
Estoy tratando de encontrar la varianza de $f(x_1)$ . Pensé que esto sería sencillo, pero cuando intento verificarlo numéricamente los resultados no coinciden con las predicciones. Este es mi enfoque:
Dejemos que $y=f(x_1)$
Dejemos que $g(x_1,x_2, \mu,\Sigma)$ sea la función de densidad de probabilidad de la variable normal bivariante.
$Var[y]=E[y^2]-E[y]^2=E[y^2]-\frac{\sigma^2}{2\pi}$
$E[y^2] = \int_{x_1=-\infty}^{\infty} \int_{x_2=-\infty}^{\infty} y^2 f(x_1) g(x_1,x_2, \mu,\Sigma) dx_2 dx_1$
Para $x_1 \geq 0$ entonces $y=x_1$ Si no es así $y=0$ por lo que la integral se simplifica en
$E[y^2] = \int_{x_1=0}^{\infty} \int_{x_2=-\infty}^{\infty} x_1^2 f(x_1) g(x_1,x_2, \mu,\Sigma) dx_2 dx_1$
Y un cambio menor:
$E[y^2] = \int_{x_1=0}^{\infty} x_1^2 f(x_1) \int_{x_2=-\infty}^{\infty} g(x_1,x_2, \mu,\Sigma) dx_2 dx_1$
Utilizo wolfram alpha para obtener el resultado (para $\mu_{x_1}=0$ ) y sustituirlo en la ecuación de la varianza:
$Var[y]=E[y^2]-\frac{\sigma^2}{2\pi}$
La fórmula de la varianza coincide con una integración numérica monte-carlo, por lo que wolfram está haciendo la integración correctamente. Desafortunadamente, las predicciones no coinciden con la varianza de la muestra de una simulación numérica de la distribución bivariada. Debido a esto creo que la forma en que configuré la integración fue incorrecta. Parece sencillo, pero no he hecho esto con funciones a trozos o múltiples variables antes.
¿Hay algún error evidente en la forma en que configuro la integral para $E[y^2]$ ?