Consideremos un estudio observacional con tratamiento binario. Denoto la variable de tratamiento como $z_i$ denote el resultado observado como $y_i$ denota el resultado potencial como $y_i(1),y_i(0)$ y denotemos las covariables como $x_i$ . Supongamos que $P(Z | Y,X) = P(Z|X)$ se cumple en este problema.
Quiero inferir el efecto medio del tratamiento de la muestra en el grupo de tratamiento, es decir $\frac{1}{\left| \{i|z_i = 1\} \right|} \sum_{i,z_i = 1} \left[Y_i(1) - Y_i(0)\right]$ . Una forma de hacerlo es retroceder $Y(0) \sim X$ utilizando los datos del grupo de control, y aplicar directamente la función de regresión $\hat{f}(X)$ al grupo de tratamiento para estimar $Y_i(0)$ Por último, utilice $\frac{1}{\left| \{i|z_i = 1\} \right|} \sum_{i,z_i = 1} \left[Y_i(1) - \hat{f}(x_i)\right]$ estimar $\frac{1}{\left| \{i|z_i = 1\} \right|} \sum_{i,z_i = 1} \left[Y_i(1) - Y_i(0)\right]$ .
El método suena raro, en realidad quiero estimar $Y(0)$ en el grupo de tratamiento, pero sólo utilizo datos del grupo de control en la regresión. ¿Cómo puedo mejorarlo?