El Efecto medio del tratamiento ( ATE ) y el Efecto medio del tratamiento sobre los tratados ( ATT ) se definen comúnmente en los diferentes grupos de individuos. Además, ATE y ATT suelen ser diferentes porque pueden medir los resultados ( $Y$ ) que no se ven afectados por el tratamiento $D$ de la misma manera.
En primer lugar, algunas anotaciones adicionales:
- $Y^0$ variable aleatoria a nivel de población para el resultado $Y$ en estado de control.
- $Y^1$ variable aleatoria a nivel de población para el resultado $Y$ en estado de tratamiento.
- $\delta$ : efecto causal a nivel individual del tratamiento.
- $\pi$ proporción de la población que toma el tratamiento.
Teniendo en cuenta lo anterior, el ATT se define como: $\mathrm{E}[\delta|D=1]$ es decir, cuál es el efecto causal esperado del tratamiento para los individuos del grupo de tratamiento. Esto puede descomponerse de forma más significativa como: \begin{align} \mathrm{E}[\delta|D=1] = & \mathrm{E}[Y^1 - Y^0|D=1] \\ & \mathrm{E}[Y^1|D=1] - \mathrm{E}[Y^0|D=1] \end{align}
(Obsérvese que $\mathrm{E}[Y^0|D=1]$ es inobservable, por lo que se refiere a una variable contrafactual que no se realiza en nuestra muestra observada). Del mismo modo, el ATE se define como: $\mathrm{E}[\delta]$ es decir, cuál es el efecto causal esperado del tratamiento en todos los individuos de la población. De nuevo, podemos descomponer esto de forma más significativa como: \begin{align} \mathrm{E}[\delta] =& \{ \pi \mathrm{E}[Y^1|D=1] + (1-\pi) \mathrm{E}[Y^1|D=0] \} \\ -& \{ \pi \mathrm{E}[Y^0|D=1] + (1-\pi) \mathrm{E}[Y^0|D=0] \} \end{align}
Al ver el ATT y el más general ATE se refieren, por definición, a diferentes porciones de la población de interés. Y lo que es más importante, en el escenario ideal de un ensayo de control aleatorio ( RCT ) ATE es igual a ATT porque lo asumimos:
- $\mathrm{E}[Y^0|D=1] = \mathrm{E}[Y^0|D=0]$ y
- $\mathrm{E}[Y^1|D=1] = \mathrm{E}[Y^1|D=0]$ ,
es decir, tenemos que creer respectivamente que:
- la línea de base del grupo de tratamiento es igual a la línea de base del grupo de control (en términos sencillos: las personas del grupo de tratamiento harían lo mismo que mala como el grupo de control si no fueron tratados) y
- el efecto del tratamiento en el grupo tratado es igual al efecto del tratamiento en el grupo de control (en términos sencillos: las personas del grupo de control harían lo mismo que buena como el grupo de tratamiento si fueron tratados).
Estas son suposiciones muy fuertes que comúnmente se violan en los estudios observacionales y, por lo tanto, el ATT y el ATE no se espera que sean iguales. (Obsérvese que si sólo las líneas de base son iguales, todavía se puede obtener un ATT a través de simples diferencias: $\mathrm{E}[Y^1|D=1] - \mathrm{E}[Y^0|D=0]$ .)
Especialmente en los casos en los que los individuos se auto-seleccionan para entrar en el grupo de tratamiento o no (por ejemplo, una tienda electrónica que proporciona bonificaciones en efectivo donde un cliente puede canjear un cupón de bonificación por $X$ cantidad dado que compra artículos por un valor mínimo de $Y$ cantidad) las líneas de base así como los efectos del tratamiento pueden ser diferentes (por ejemplo, es más probable que los compradores habituales canjeen dicha bonificación, los clientes de bajo valor podrían encontrar el umbral $Y$ los clientes poco realistas o de alto valor podrían ser indiferentes al importe de la bonificación $X$ - esto también se relaciona con SUTVA ). En escenarios como éste, incluso hablar de ATE probablemente esté mal definida (por ejemplo, no es realista esperar que todos los clientes de una tienda electrónica compren alguna vez artículos por valor de $Y$ ).
ATT siendo desigual a ATE no es inesperado. Si ATT es menor o mayor que ATE es específico de la aplicación. La desigualdad de los dos sugiere que el mecanismo de asignación del tratamiento no fue potencialmente aleatorio. En general, en un estudio observacional, dado que los supuestos mencionados no suelen cumplirse, o bien dividimos nuestra muestra en consecuencia o bien controlamos las diferencias mediante técnicas "similares a la regresión".
Para una exposición más detallada, pero fácil de seguir, recomiendo consultar el libro de Morgan & Winship Contrafactualidad e inferencia causal .