3 votos

Significado de las exposiciones múltiples en un DAG

Estoy trabajando con DAGs como una forma de hacer algunos modelos causales. Estoy utilizando dagitty - tanto el sitio web como el paquete R. Creo que tengo un buen conocimiento de la mayoría de las cosas relacionadas con la confusión, los conjuntos de ajuste, etc. Sin embargo, hay algo que me confunde. Permítanme demostrarlo con un ejemplo.

Supongamos que tengo el DAG enter image description here

Entiendo (y dagitty lo confirma) que para extraer un valor causal para E1 necesito ajustar por C. Dagitty informa "

dagitty adjustment set

Así, por ejemplo, si todo fuera lineal, construiría un modelo O ~ E1 + C, e interpretaría el coeficiente de E1 como causal. Entiendo que no puede interpretar C como causal - esto violaría la "Falacia de la tabla 2" .

Ahora viene la parte que me confunde. Dagitty permite al usuario elegir múltiples exposiciones . Así, por ejemplo, puedo elegir tanto E1 como C como "exposiciones".

enter image description here

Dagitty me dice ahora que "No es necesario ningún ajuste para estimar el efecto total de E1,C en O". Esto sería parece para sugerir que el mismo modelo: O ~ E1 + C puede ser utilizado, pero ahora "ambos E1 y C tienen un significado casual. Obviamente, esto es erróneo.

Mi pregunta es: ¿qué significa "el efecto total de E1,C"? Dado que C es la causa de E1 (según mi diagrama), no puedo establecerlos de forma independiente. Más generalmente, ¿cuál es el significado de cualquier selección de exposiciones múltiples. En otras palabras, digamos que tengo el DAG E1 -> O <- E2. ¿Cuál sería el significado de establecer ambos ¿E1 y E2 como exposiciones?

Gracias de antemano por cualquier explicación. Cada vez que creo que he entendido la inferencia causal, aparece una nueva "arruga".

4voto

Forest Puntos 1

El problema es el mismo procedimiento de estimación que utilizó en el primer caso, no puede en el segundo.

DAG 1 :

En el primer caso, se basa en un caso muy especial en el que se puede estimar el efecto causal medio (ACE). En concreto, si (1) el resultado es continuo, (2) la especificación del modelo real no tiene términos de interacción, y (3) una única exposición; entonces el coeficiente de $E1$ puede interpretarse como el ACE para $E1$ en $O$ . Como usted dice, tratando de interpretar el coeficiente para $C$ conduce a la falacia de la tabla 2.

Un enfoque más general (es decir, que funciona cuando el resultado no es continuo o cuando hay términos de interacción) es g-computación . Brevemente, estimaríamos el modelo de resultados como se sugiere. A continuación, estableceríamos manualmente $E1 = 1$ en una copia del conjunto de datos y utilizar el modelo ajustado para predecir $O$ para todos con $E1$ . Este proceso se repetiría para $E1=0$ . Entonces tomaríamos la media de esas predicciones bajo cada conjunto $E1$ y luego restar. Esto nos da la ACE al tiempo que permite modelos más complejos. Además, evita la falacia de la Tabla 2 al proporcionar únicamente la ACE como resultado.

DAG 2 :

Ahora, en el segundo ejemplo, se intenta utilizar el truco de la regresión lineal, pero no funcionará en este caso. Ahora hay dos exposiciones que estamos estableciendo. Específicamente, podemos querer estimar la ECA si todos hubieran recibido $E1=1,C=1$ frente a los que se les ha dado a todos $E1=0,C=0$ . Los coeficientes de regresión lineal no pueden dar estas comparaciones (ya que condicionan al otro). Si se intentan interpretar de nuevo estas cuestiones, se acabaría con la falacia de la tabla 2. Sin embargo, el problema no está en la identificación, sino en el enfoque de estimación que está utilizando.

En su lugar, puede utilizar el procedimiento de cálculo g. Después de estimar el modelo (como se ha hecho antes), ahora se establecerían los dos $E1$ y $C$ y luego generar los valores predichos. Por lo tanto, el problema no está en la identificación (daggity tiene razón al decir que los efectos causales son identificables) sino que es un problema en la estrategia de estimación (ya que es un caso especial que no se aplica en esta última).

Desde una perspectiva gráfica. El $C \rightarrow E1$ en el segundo DAG no significa mucho. En nuestra intervención (en ambas exposiciones), estamos fijando ambos $E1$ y $C$ . Fijando ambos, $C$ ya no sería predictivo de $E1$ (por ejemplo, estamos fijando $E1 = 1$ bajo nuestra intervención y no depende del valor de $C$ ).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X