No hay contradicción entre el mundo de los hechos y la acción de interés en el nivel de intervención. Por ejemplo, fumar hasta hoy y verse obligado a dejar de fumar a partir de mañana no se contradicen, aunque se podría decir que uno "niega" al otro. Pero ahora imagine el siguiente escenario. Usted conoce a Joe, un fumador de toda la vida que tiene cáncer de pulmón, y se pregunta: ¿y si Joe no hubiera fumado durante treinta años, estaría sano hoy? En este caso se trata de la misma persona, en el mismo tiempo, imaginando un escenario en el que la acción y el resultado están en contradicción directa con los hechos conocidos.
Así, la principal diferencia de las intervenciones y los contrafactuales es que, mientras que en las intervenciones se pregunta qué ocurrirá por término medio si se realiza una acción, en los contrafactuales se pregunta qué habría ocurrido si se hubiera seguido un curso de acción distinto en una situación concreta, dado que usted tiene información sobre lo que realmente sucedió. Tenga en cuenta que, como ya sabe lo que ocurrió en el mundo real, necesita actualizar su información sobre el pasado a la luz de las pruebas que ha observado.
Estos dos tipos de consultas son matemáticamente distintos porque requieren distintos niveles de información (los contrafácticos necesitan más información para ser respondidos) y un lenguaje aún más elaborado para ser articulados!.
Con la información necesaria para responder a las preguntas del nivel 3, podrá responder a las preguntas del nivel 2, pero no al revés. Más concretamente, no se puede responder a las preguntas contrafácticas sólo con información intervencionista. En CV ya se han dado ejemplos del choque entre intervenciones y contrafactuales, véase esta entrada y esta entrada . Sin embargo, en aras de la exhaustividad, también incluiré aquí un ejemplo.
El siguiente ejemplo se encuentra en Causalidad, sección 1.4.4.
Considere que ha realizado un experimento aleatorio en el que los pacientes fueron asignados al azar (50% / 50%) a un tratamiento ( $x =1$ ) y las condiciones de control ( $x=0$ ), y tanto en el grupo de tratamiento como en el de control se recuperó el 50% ( $y=0$ ) y el 50% murió ( $y=1$ ). Es decir $P(y|x) = 0.5~~~\forall x,y$ .
El resultado del experimento indica que el efecto causal medio de la intervención es cero. Se trata de una pregunta de nivel 2, $P(Y = 1|do(X = 1)) - P(Y=1|do(X =0) = 0$ .
Pero hagámonos ahora la siguiente pregunta: ¿qué porcentaje de los pacientes que murieron bajo tratamiento se habrían recuperado si no lo hubieran tomado? Matemáticamente, se quiere calcular $P(Y_{0} = 0|X =1, Y = 1)$ .
Esta pregunta no puede responderse sólo con los datos de intervención de que dispone. La prueba es sencilla: Puedo crear dos modelos causales diferentes que tendrán las mismas distribuciones intervencionales, pero diferentes distribuciones contrafactuales. A continuación se presentan los dos:
Toma, $U$ equivale a factores no observados que explican cómo reacciona el paciente al tratamiento. Se puede pensar, por ejemplo, en factores que explican la heterogeneidad del tratamiento. Obsérvese la distribución marginal $P(y, x)$ de ambos modelos coinciden.
Obsérvese que, en el primer modelo, nadie se ve afectado por el tratamiento, por lo que el porcentaje de pacientes fallecidos bajo tratamiento que se habrían recuperado de no haber tomado el tratamiento es cero.
Sin embargo, en el segundo modelo, todos los pacientes se ven afectados por el tratamiento, y tenemos una mezcla de dos poblaciones en la que el efecto causal medio resulta ser cero. En este ejemplo, la cantidad contrafactual pasa a ser del 100%: en el modelo 2, todos los pacientes que murieron bajo tratamiento se habrían recuperado si no lo hubieran tomado.
Así, hay una clara distinción entre el peldaño 2 y el peldaño 3. Como muestra el ejemplo, no se puede responder a preguntas contrafácticas sólo con información y supuestos sobre las intervenciones. Esto queda claro con los tres pasos para calcular un contrafactual:
- Paso 1 (abducción): actualizar la probabilidad de factores no observados $P(u)$ a la luz de las pruebas observadas $P(u|e)$
- Paso 2 (acción): realizar la acción en el modelo (por ejemplo $do(x))$ .
- Paso 3 (predicción): predecir $Y$ en el modelo modificado.
Esto no será posible de calcular sin alguna información funcional sobre el modelo causal, o sin alguna información sobre las variables latentes.
0 votos
¿Es esto realmente sobre el tema? Pregunto por curiosidad
6 votos
@Firebug ¿la causalidad está en el tema? Si quieres calcular la probabilidad de contrafactuales (como la probabilidad de que una droga específica fuera suficiente para la muerte de alguien) necesitas entender esto.
8 votos
twitter.com/yudapearl/status/1069533953223155713 ¡!