2 votos

Inferencia causal con ausencia de confusión

Consideremos un estudio observacional con tratamiento binario. Denoto la variable de tratamiento como $z_i$ denote el resultado observado como $y_i$ denota el resultado potencial como $y_i(1),y_i(0)$ y denotemos las covariables como $x_i$ . Supongamos que $P(Z | Y,X) = P(Z|X)$ se cumple en este problema.

Quiero inferir el efecto medio del tratamiento de la muestra en el grupo de tratamiento, es decir $\frac{1}{\left| \{i|z_i = 1\} \right|} \sum_{i,z_i = 1} \left[Y_i(1) - Y_i(0)\right]$ . Una forma de hacerlo es retroceder $Y(0) \sim X$ utilizando los datos del grupo de control, y aplicar directamente la función de regresión $\hat{f}(X)$ al grupo de tratamiento para estimar $Y_i(0)$ Por último, utilice $\frac{1}{\left| \{i|z_i = 1\} \right|} \sum_{i,z_i = 1} \left[Y_i(1) - \hat{f}(x_i)\right]$ estimar $\frac{1}{\left| \{i|z_i = 1\} \right|} \sum_{i,z_i = 1} \left[Y_i(1) - Y_i(0)\right]$ .

El método suena raro, en realidad quiero estimar $Y(0)$ en el grupo de tratamiento, pero sólo utilizo datos del grupo de control en la regresión. ¿Cómo puedo mejorarlo?

0voto

Noah Puntos 85

Las unidades del grupo de control proporcionan información sobre la relación entre la $X$ y $Y(0)$ porque para esas unidades, $Y$ (el resultado observado) es igual a $Y(0)$ . Si desea $Y(0)$ en el grupo tratado, puede utilizar esa información para estimarlo a partir de $X$ en el grupo tratado, tal y como usted describe.

Para las unidades tratadas, tiene $Y_i(1)$ porque $Y_i = Y_i(1)$ para ellos. No es una estimación de $Y_i(1)$ ; lo es $Y_i(1)$ . Sólo del grupo tratado disponemos de la mitad de la información necesaria para estimar $\frac{1}{|{i|z_i=1}|} \sum_{i,z_i=1} [Y_i(1)-Y_i(0)]$ es decir, el SATT, porque tenemos $Y_i(1)$ para $i$ donde $z_i=1$ sin hacer ningún modelo. Sin embargo, para estas unidades, $Y_i(0)$ falta. No sabemos qué habría pasado si las unidades tratadas hubieran recibido el control.

¿Cómo podríamos conseguir $Y_i(0)$ para las unidades tratadas? Para esas unidades, es inobservable, por lo que ningún modelo de sólo las unidades tratadas podría decirle la relación entre $X$ y $Y_i(0)$ . Esta información sólo existe en el grupo de control. Por tanto, aunque estemos interesados en una cualidad del grupo tratado (es decir, el SATT del grupo tratado), nosotros tienen consultar al grupo de control porque sólo éste contiene información que puede ayudarnos a rellenar la otra mitad de la estimación del SATT.

Existen, por supuesto, otros métodos para estimar el SATT, como la ponderación y el emparejamiento, que no requieren que se estime $Y_i(0)$ para cada unidad tratada. Pero, como $Y_i(0)$ sólo se observa en las unidades de control, debemos incluirlas en el análisis.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X