23 votos

Inconfundibilidad en el modelo causal de Rubin - Explicación para profanos

Al implementar el modelo causal de Rubin, una de las suposiciones (no comprobables) que necesitamos es la no confusión, lo que significa que

$$(Y(0),Y(1))\perp T|X$$

Donde el LHS son los contrafactuales, el T es el tratamiento, y X son las covariables que controlamos.

Me pregunto cómo describir esto a una persona que no sepa mucho sobre el modelo causal de Rubin. Entiendo por qué teóricamente necesitamos este supuesto, pero no estoy seguro de por qué conceptualmente es importante. En concreto, si T es el tratamiento, ¿no debería depender mucho de él el resultado potencial? Además, si tenemos un ensayo controlado aleatorio, entonces automáticamente, $(Y(0),Y(1))\perp T$ . ¿Por qué es así?

¿Cómo describiría el supuesto de infundabilidad/ignorabilidad a alguien que no haya estudiado el MCR?

20voto

Neal Puntos 316

Creo que te estás obsesionando con la diferencia entre los resultados potenciales $(Y^0,Y^1)$ y el resultado observado $Y$ . Este último está muy influido por el tratamiento, pero esperamos que el primer par no lo esté.

He aquí la intuición (dejando de lado el condicionamiento sobre $X$ para simplificar) sobre el resultado observado. Para cada observación, el resultado realizado puede expresarse como

$$Y=T \cdot Y^1 + (1-T) \cdot Y^0.$$

Esto significa que $Y$ y $T$ son dependientes porque el valor medio de $T \cdot Y^1$ no será igual a la media $(1-T)\cdot Y^0$ (siempre que el efecto del tratamiento sea distinto de cero y el tratamiento sea aleatorio/ignorable).

Esta es la intuición para la segunda parte. Si vamos a conocer el efecto causal de $T$ compararemos las observaciones tratadas con las no tratadas, teniendo en cuenta las diferencias de $X$ en cuenta. Suponemos que el grupo de control es el contrafactual del grupo de tratamiento si no lo hubiera recibido. Pero si las personas eligen su propio tratamiento en función de sus resultados potenciales (o expectativas sobre los resultados potenciales), esta comparación es de manzanas con orangutanes. Es como un ensayo médico en el que sólo los pacientes más sanos optan por la cirugía dolorosa porque les compensa el coste. Nuestra comparación estará contaminada si la elección de optar por el tratamiento no es aleatoria tras condicionarla a $X$ (variables que miden el estado de salud actual y que deben ser observables para el médico y los pacientes). Un ejemplo de variable inobservable podría ser tener una esposa que te quiere mucho, por lo que te anima a operarte, pero también se asegura de que sigas las instrucciones del médico después de la operación, con lo que mejora tu salud. $Y^1$ resultado. El efecto medido es ahora una combinación de cirugía y ayuda cariñosa, que no es lo que queremos medir. Un ejemplo mejor es un $X$ que se ve afectado por el tratamiento, ya sea ex post o ex ante en previsión del tratamiento.

18voto

Ran Kerry Puntos 1

¿Cómo describiría el supuesto de infundabilidad/ignorabilidad a alguien que no haya estudiado el MCR?

En cuanto a la intuición para alguien no versado en la inferencia causal, creo que aquí es donde se podrían utilizar los gráficos. Son intuitivos en el sentido de que muestran visualmente el "flujo" y también dejarán claro lo que significa sustancialmente la ignorabilidad en el mundo real.

La ignorabilidad condicional equivale a afirmar $X$ cumple el criterio de la puerta trasera. Así que, en términos intuitivos, se puede decir a la persona que las covariables que eligió para $X$ "bloquea" el efecto de las causas comunes de $T$ y $Y$ (y no abra ninguna otra asociación espuria).

Si las únicas variables de confusión concebibles de su problema son las variables en $X$ es trivial de explicar. Basta con decir que como $X$ contais todas las causas comunes de ambos $T$ y $Y$ Eso es todo lo que necesitas controlar. Así que podrías decirle que así es como ves el mundo:

enter image description here

El caso más interesante es cuando puede haber otros factores de confusión plausibles. Para ser más específicos, incluso se podría pedir a la persona que nombrara un posible factor de confusión del problema, es decir, pedirle que nombrara algo que cause tanto $T$ y $Y$ pero no está en $X$ .

Digamos que la persona nombra una variable $Z$ . Entonces puedes decirle a esa persona que lo que tu suposición de ignorabilidad condicional significa efectivamente es que crees que $X$ bloqueará" el efecto de $Z$ en $T$ y/o $Y$ .

Y deberías darle una razón de peso por la que crees que eso es cierto. Hay muchos gráficos que podrían representar eso, pero digamos que se te ocurre esta explicación: " $Z$ no sesgará los resultados porque aunque $Z$ causa $T$ y $Y$ su efecto sobre $T$ sólo pasa por $X$ que estamos controlando". Y luego muestra este gráfico:

enter image description here

Y podrías pensar en otros cofundadores y mostrarle cómo $X$ es bloquearlos visualmente en los gráficos.

Respondiendo ahora a las preguntas conceptuales:

En concreto, si T es el tratamiento, debe ser muy dependiente de él? Además, si tenemos un ensayo controlado aleatorio aleatorio, automáticamente ¿Por qué es esto cierto?

No. Piensa en $T$ como asignación al tratamiento. Lo que dice es que usted está asignando el tratamiento a personas "ignorando" cómo responden al tratamiento (los resultados potenciales contrafactuales). Una infracción simple de esta norma sería que usted tendiera a dar el tratamiento a quienes potencialmente se beneficiarían más de él.

También por eso esto se mantiene automáticamente cuando se aleatoriza. Si eliges a los tratados al azar, significa que no has comprobado sus posibles respuestas al tratamiento para seleccionarlos.


Para complementar la respuesta, cabe señalar que entender la ignorabilidad sin hablar del proceso causal, es decir, sin invocar ecuaciones estructurales/modelos gráficos es realmente difícil. La mayoría de las veces se ve a los investigadores apelar a la idea de que "el tratamiento fue como si fuera aleatorio", pero sin justificar por qué es así o por qué es plausible utilizando mecanismos y procesos del mundo real.

De hecho, muchos investigadores simplemente asumen la ignorabilidad por conveniencia, para justificar el uso de métodos estadísticos. Este pasaje de Documento de Joffe, Yang y Feldman dice una verdad incómoda que la mayoría de la gente conoce pero no dice durante las presentaciones de conferencias: "Los supuestos de ignorabilidad suelen hacerse porque justifican el uso de los métodos estadísticos disponibles, y no porque se crean de verdad".

Pero, como he dicho al principio de la respuesta, se pueden utilizar gráficos para argumentar si una asignación de tratamiento es ignorable o no. Mientras que el concepto de ignorabilidad en sí es difícil de entender, porque establece juicios sobre cantidades contrafácticas, en los gráficos básicamente estás haciendo afirmaciones cualitativas sobre procesos causales (esta variable causa aquella variable, etc.), que son fáciles de explicar y visualmente atractivas.

Como ya se ha mencionado en una respuesta anterior, hay una equivalencia formal entre gráficos y resultados potenciales . Por lo tanto, también se pueden leer los resultados potenciales de los gráficos. Haciendo esta conexión más formal (para más información, véase Pearl's Causality, p.343), podría recurrir a la siguiente definición: los resultados potenciales representarían el total de todas las variables (términos observados y de error) que afectan a Y cuando T se mantiene constante.

Entonces es fácil ver por qué la ignorabilidad se mantiene en la ECA, pero lo que es más importante, también permite detectar fácilmente situaciones en las que la ignorabilidad no se mantendría. Por ejemplo, en el gráfico $T \rightarrow X \rightarrow Y$ T es ignorable, pero T no es condicionalmente ignorable dado X, porque una vez que condicionas en X, abres un camino de colisión desde el término de error de X a T.

En resumen, muchos investigadores adoptan la hipótesis de ignorabilidad por defecto, por comodidad. Es una forma cómoda de suponer la suficiencia de un conjunto de controles sin necesidad de justificar formalmente por qué es así, pero para explicar lo que significa en un contexto real para un profano, habría que invocar una historia causal, es decir, supuestos causales, y se puede contar formalmente esa historia con la ayuda de gráficos causales.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X