$\newcommand{\pperp}{\perp\kern-5pt\perp}$ Una buena referencia para esto es
Morgan, Stephen L., y Christopher Winship. Contrarios y inferencia causal. Cambridge University Press, 2015.
En el marco de resultados potenciales, si consideramos una variable de tratamiento binaria $D$ (por ejemplo, placebo o medicina real), a cada individuo se le asignan dos llamados resultados potenciales $Y^0$ y $Y^1$ (por ejemplo, curado o no curado), un resultado $Y^0$ que obtendríamos para este individuo si no fuera tratado (placebo) y un resultado $Y^1$ para este individuo si fuera tratado (medicina real). Es decir, si $Y$ es la variable aleatoria de resultado, entonces $$ \begin{align} Y=Y^0 \quad &\mbox{si}\quad D=0\\ Y=Y^1 \quad &\mbox{si}\quad D=1. \end{align} $$
Claramente, la asignación del tratamiento debe ser independiente del resultado potencial: $$ (Y^0, Y^1) \pperp D. $$ Por ejemplo, imagina que la medicina real se administra principalmente a personas realmente enfermas mientras que el placebo se da principalmente a individuos más saludables que se recuperarían de todos modos. Esto sesgaría los resultados. Ten en cuenta que esta independencia siempre se da si tienes una adecuada aleatorización en la asignación del tratamiento. Ahora, esta independencia es casi lo que se llama ignorabilidad, pero no del todo. Sigue leyendo.
Desafortunadamente, muy a menudo no tenemos datos aleatorizados. Entonces, el desafío es obtener efectos de tratamiento adecuados de los datos no aleatorizados. A menudo esto se puede hacer, por ejemplo, mediante el criterio de la puerta trasera. En pocas palabras, encuentras un conjunto $S$ de variables adicionales tales que, al condicionarlas, obtendrás la independencia mencionada anteriormente, es decir: $$ \tag{*}\label{ignor} (Y^0, Y^1) \pperp D \;|\; S. $$ Esto se lee: "Los resultados potenciales $Y^0, Y^1$ son independientes del tratamiento $D$ dado las covariables en el conjunto $S$". Por ejemplo, en el ejemplo anterior, imagina que $S$ consistiría en solo una variable binaria, es decir, la variable de que el individuo está muy enfermo o solo ligeramente enfermo. Eso significa que, si solo considero a los ligeramente enfermos, no habría dependencia entre $D$ y $(Y^0, Y^1)$ e igualmente para los muy enfermos.
Y esta es la definición completa de ignorabilidad: si encuentras un conjunto de covariables $S$ tal que se satisface $\eqref{ignor}$, entonces la asignación del tratamiento satisface la ignorabilidad.
0 votos
Por favor, indique la fuente de esta declaración.