33 votos

Diferencia entre los peldaños dos y tres de la Escala de Causalidad

En el "Libro del porqué" de Judea Pearl habla de lo que él llama la Escalera de la Causalidad, que es esencialmente una jerarquía compuesta de diferentes niveles de razonamiento causal. El más bajo se refiere a los patrones de asociación en los datos observados (por ejemplo, correlación, probabilidad condicional, etc.), el siguiente se centra en la intervención (¿qué ocurre si cambiamos deliberadamente el proceso de generación de datos de alguna manera preestablecida?), y el tercero es contrafáctico (¿qué ocurriría en otro mundo posible si algo hubiera ocurrido o no)?

Lo que no entiendo es en qué se diferencian los peldaños dos y tres. Si planteamos una pregunta contrafactual, ¿no estamos planteando simplemente una pregunta sobre intervenir para negar algún aspecto del mundo observado?

0 votos

¿Es esto realmente sobre el tema? Pregunto por curiosidad

6 votos

@Firebug ¿la causalidad está en el tema? Si quieres calcular la probabilidad de contrafactuales (como la probabilidad de que una droga específica fuera suficiente para la muerte de alguien) necesitas entender esto.

8 votos

30voto

Ran Kerry Puntos 1

No hay contradicción entre el mundo de los hechos y la acción de interés en el nivel de intervención. Por ejemplo, fumar hasta hoy y verse obligado a dejar de fumar a partir de mañana no se contradicen, aunque se podría decir que uno "niega" al otro. Pero ahora imagine el siguiente escenario. Usted conoce a Joe, un fumador de toda la vida que tiene cáncer de pulmón, y se pregunta: ¿y si Joe no hubiera fumado durante treinta años, estaría sano hoy? En este caso se trata de la misma persona, en el mismo tiempo, imaginando un escenario en el que la acción y el resultado están en contradicción directa con los hechos conocidos.

Así, la principal diferencia de las intervenciones y los contrafactuales es que, mientras que en las intervenciones se pregunta qué ocurrirá por término medio si se realiza una acción, en los contrafactuales se pregunta qué habría ocurrido si se hubiera seguido un curso de acción distinto en una situación concreta, dado que usted tiene información sobre lo que realmente sucedió. Tenga en cuenta que, como ya sabe lo que ocurrió en el mundo real, necesita actualizar su información sobre el pasado a la luz de las pruebas que ha observado.

Estos dos tipos de consultas son matemáticamente distintos porque requieren distintos niveles de información (los contrafácticos necesitan más información para ser respondidos) y un lenguaje aún más elaborado para ser articulados!.

Con la información necesaria para responder a las preguntas del nivel 3, podrá responder a las preguntas del nivel 2, pero no al revés. Más concretamente, no se puede responder a las preguntas contrafácticas sólo con información intervencionista. En CV ya se han dado ejemplos del choque entre intervenciones y contrafactuales, véase esta entrada y esta entrada . Sin embargo, en aras de la exhaustividad, también incluiré aquí un ejemplo.

El siguiente ejemplo se encuentra en Causalidad, sección 1.4.4.

Considere que ha realizado un experimento aleatorio en el que los pacientes fueron asignados al azar (50% / 50%) a un tratamiento ( $x =1$ ) y las condiciones de control ( $x=0$ ), y tanto en el grupo de tratamiento como en el de control se recuperó el 50% ( $y=0$ ) y el 50% murió ( $y=1$ ). Es decir $P(y|x) = 0.5~~~\forall x,y$ .

El resultado del experimento indica que el efecto causal medio de la intervención es cero. Se trata de una pregunta de nivel 2, $P(Y = 1|do(X = 1)) - P(Y=1|do(X =0) = 0$ .

Pero hagámonos ahora la siguiente pregunta: ¿qué porcentaje de los pacientes que murieron bajo tratamiento se habrían recuperado si no lo hubieran tomado? Matemáticamente, se quiere calcular $P(Y_{0} = 0|X =1, Y = 1)$ .

Esta pregunta no puede responderse sólo con los datos de intervención de que dispone. La prueba es sencilla: Puedo crear dos modelos causales diferentes que tendrán las mismas distribuciones intervencionales, pero diferentes distribuciones contrafactuales. A continuación se presentan los dos:

enter image description here

Toma, $U$ equivale a factores no observados que explican cómo reacciona el paciente al tratamiento. Se puede pensar, por ejemplo, en factores que explican la heterogeneidad del tratamiento. Obsérvese la distribución marginal $P(y, x)$ de ambos modelos coinciden.

Obsérvese que, en el primer modelo, nadie se ve afectado por el tratamiento, por lo que el porcentaje de pacientes fallecidos bajo tratamiento que se habrían recuperado de no haber tomado el tratamiento es cero.

Sin embargo, en el segundo modelo, todos los pacientes se ven afectados por el tratamiento, y tenemos una mezcla de dos poblaciones en la que el efecto causal medio resulta ser cero. En este ejemplo, la cantidad contrafactual pasa a ser del 100%: en el modelo 2, todos los pacientes que murieron bajo tratamiento se habrían recuperado si no lo hubieran tomado.

Así, hay una clara distinción entre el peldaño 2 y el peldaño 3. Como muestra el ejemplo, no se puede responder a preguntas contrafácticas sólo con información y supuestos sobre las intervenciones. Esto queda claro con los tres pasos para calcular un contrafactual:

  1. Paso 1 (abducción): actualizar la probabilidad de factores no observados $P(u)$ a la luz de las pruebas observadas $P(u|e)$
  2. Paso 2 (acción): realizar la acción en el modelo (por ejemplo $do(x))$ .
  3. Paso 3 (predicción): predecir $Y$ en el modelo modificado.

Esto no será posible de calcular sin alguna información funcional sobre el modelo causal, o sin alguna información sobre las variables latentes.

1 votos

¡Interesante respuesta! Un par de preguntas complementarias: 1) Usted dice " Con la información del nivel 3 puedes responder a las preguntas del nivel 2, pero no al revés. ". Pero en tu ejemplo de fumar, no entiendo cómo saber si Joe estaría sano si nunca hubiera fumado responde a la pregunta "¿Estaría sano si dejara de fumar mañana después de 30 años fumando?". Parecen preguntas distintas, así que creo que me estoy perdiendo algo.

2 votos

Además, su ejemplo práctico posterior se basa en que las 2 variables no observadas no se distribuyen aleatoriamente entre el tratamiento y el control. Pero lo has descrito como un experimento aleatorio, así que ¿no es un caso de mala aleatorización? Con una aleatorización adecuada, no veo cómo se obtienen dos resultados tan diferentes, a menos que me esté perdiendo algo básico.

0 votos

@mkt del último al primero. La variable no observada se distribuye aleatoriamente entre el grupo tratado y el grupo de control, de modo que hay exactamente un 50% de cada categoría de u en ambos grupos. Por información entendemos la especificación parcial del modelo necesaria para responder a preguntas contrafactuales en general, no la respuesta a una pregunta específica. Para responder a las preguntas contrafactuales se necesita la estructura causal + alguna información funcional o información de la distribución de las variables latentes.

5voto

RainyRat Puntos 3525

Aquí está la respuesta Judea Pearl dio en twitter :

Los lectores preguntan: ¿Por qué la intervención (Rung-2) es diferente de la contrafactual (Rung-3)? ¿Intervenir no niega algunos aspectos del mundo observado? del mundo observado?

Ans. Las intervenciones cambian el mundo observado, pero no lo contradicen, porque el mundo antes y después de la intervención implica variables distintas en el tiempo. En cambio, "Si hubiera estado muerto" contradice hechos conocidos. Para un debate reciente, véase este debate .

Observación: Tanto el grupo #causalinference de Harvard como el potencial de Rubin de Rubin no distinguen entre Rung-2 y Rung-3.

Se trata, en mi opinión, de una resistencia culturalmente arraigada que se rectificada en el futuro. Se deriva del origen de ambos marcos en la metáfora "como al azar", en contraposición a la metáfora física metáfora de la "escucha" de #Bookofwhy

2voto

Slider345 Puntos 1206

Las preguntas contrafácticas son también preguntas sobre la intervención. Pero la diferencia es que las ruido (que pueden incluir factores de confusión no observados) son sin remuestreo pero tienen que ser idéntico como en la observación.

Los contrafactuales se calculan en los MCE mediante el siguiente procedimiento:

  1. Actualizar la distribución de ruido a su posterior dada la evidencia observada ("abducción").
  2. Manipular las ecuaciones estructurales para capturar la hipotética intervención ("acción").
  3. Utilice el MCE modificado para inferir la cantidad de interés ("predicción").

Ejemplo 4.11 de este documento lo explica intuitivamente con números sencillos.

1voto

Robert Schroeder Puntos 1306

Para añadir más información a esta pregunta y a las demás respuestas:

Intervención: Queremos responder/predecir qué ocurrirá con la variable $Z$ si intervenimos sobre una variable $X$ en el presente .

Contrafactual: Queremos responder/predecir qué pasaría con la variable $Z$ si hubiéramos intervenido en una variable $X$ en el pasado . Pero el mundo ha avanzado y muchas otras variables del sistema han cambiado. Por lo tanto, no podemos utilizar la intervención en el presente para responder a tal escenario.

Por último, un ejemplo para dejar clara la diferencia entre intervención (escalón 2) y contrafactual (escalón 3). Suponiendo que haya 3 variables $X, Y, Z$ con $Z$ siendo un efecto común de $X$ y $Y$ como se muestra en el gráfico siguiente:

Common effect causal model

Ahora, en el escalón 2 (intervención), si realizamos una acción/intervención sobre $X$ El valor de $Y$ podría cambiar/adaptarse . Sin embargo, el escalón 3 (contrafactual), puede considerarse como una intervención imaginaria en el gráfico, mientras que todas las variables que no se ven afectadas por la intervención imaginaria, aquí $Y$ , tienen que permanecer fijos en los niveles/valores que observamos antes de la acción. Por lo tanto, los valor de $Y$ no cambia/no se adapta .

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X