Perdón por el título tan largo, pero mi problema es bastante específico y difícil de explicar en un título.
Actualmente estoy aprendiendo sobre el Modelo de Roy (análisis del efecto del tratamiento).
Hay un paso de derivación en mis diapositivas, que no entiendo.
Calculamos el resultado esperado con tratamiento en el grupo de tratamiento (dummy D es tratamiento o no tratamiento). Se escribe como
\begin{align} E[Y_1|D=1] \end{align}
desde $Y_1=\mu_1 + U_1$ se puede reescribir como \begin{align} E[Y_1|D=1] &= E[\mu_1+U_1|D=1]\\ &=\mu_1+ E[U_1|D=1] \end{align} antes también dijimos, que $D=1$ si $Y_1>Y_0$ por lo que se deduce:
$Y_1-Y_0>0$
$\mu_1+U_1-(\mu_0-U_0)>0$
$(\mu_1+U_1)/\sigma-(\mu_0-U_0)/ \sigma >0$
$Z-\epsilon>0$
así que $D=1$ si $\epsilon<Z$
Por lo tanto, se sostiene que \begin{align} E[Y_1|D=1] &=\mu_1 + E[U_1|\epsilon<Z] \end{align}
Además, se sabe que \begin{align} \begin{bmatrix} U_1 \\ U_0 \\ \epsilon \end{bmatrix} =N\left( \begin{bmatrix} 0 \\ 0 \\ 0 \end{bmatrix} , \begin{bmatrix} \sigma_1^2 & \sigma_{10} & \sigma_{1\epsilon} \\ \sigma_{10} & \sigma_{0}^2 & \sigma_{0\epsilon} \\ \sigma_{1\epsilon} & \sigma_{0\epsilon} & \sigma_{\epsilon}^2 \end{bmatrix} \(derecha) \end{align}
por lo tanto se deduce: $P(D=1)=P(\epsilon<Z)=\Phi(Z)$
Así que ahora viene mi pregunta, las diapositivas dicen, que \begin{align} \mu_1 - E[U_1|\epsilon<Z] =\mu_1 - \sigma_{1\epsilon} \frac{\phi(Z)}{\Phi(Z)} \end{align} ¿Y no entiendo por qué?
Sé, que si dos variables aleatorias siguen una distribución normal bivariada estándar: $E[u_1|u_2)=\rho u_2$
así que $E[u_1|u_2>c)=E[\rho u_2|u_2>c]=\rho E[u_2|u_2>c)=\rho\frac{\phi(c)}{1-\Phi(c)}$
Por lo tanto, habría esperado un "más" y no un signo menos. ¿Por qué utilizamos también la covarianza $\sigma_{1\epsilon}$ y no la correlación $\rho$ ? Así que habría esperado algo como
\begin{align} \mu_1 - E[U_1|\epsilon<Z] =\mu_1 + \rho \frac{\phi(Z)}{\Phi(Z)} \end{align}
Soy consciente del hecho, de que si hago el truncamiento desde arriba el $1-\Phi(c)$ se convierte en $\Phi(c)$ .