30 votos

Representación de efectos de interacción en grafos acíclicos dirigidos

Grafos acíclicos dirigidos (DAGs; por ejemplo, Greenland, et al, 1999) forman parte de un formalismo de inferencia causal a partir de la interpretación contrafactual del campo de causalidad. En estos grafos, la presencia de una flecha desde la variable $A$ a variable $B$ afirma que la variable $A$ causa directamente (algún cambio en el riesgo de) variable $B$ y la ausencia de tal flecha afirma que la variable $A$ no causa directamente (algún cambio en el riesgo de) variable $B$ .

A modo de ejemplo, la afirmación "la exposición al humo del tabaco provoca directamente un cambio en el riesgo de mesotelioma" se representa mediante la flecha negra que va de "exposición al humo del tabaco" a "mesotelioma" en el gráfico no es un DAG diagrama causal que figura a continuación.

Del mismo modo, la afirmación "la exposición al amianto provoca directamente un cambio en el riesgo de mesotelioma" está representada por la flecha negra que va de "exposición al amianto" a "mesotelioma" en el gráfico no es un DAG gráfico causal a continuación.

Utilizo el término no es un DAG para describir el siguiente gráfico causal debido a la flecha roja, que pretendo afirmar algo así como "la exposición al amianto provoca un cambio en el efecto causal directo de la exposición al humo del tabaco en el riesgo de mesotelioma" (el amianto provoca daños físicos en las células del pulmón que, además de causar directamente un cambio en el riesgo de mesotelioma, también hace que las células sean más susceptibles a los daños cancerígenos de la exposición al humo del tabaco, con el resultado de que la exposición tanto al amianto como al tabaco provoca un aumento del riesgo que es mayor que la suma de los dos riesgos por separado), y esto no encaja del todo con el significado formal de las flechas causales en los DAG que he descrito al principio de mi pregunta (es decir, porque la flecha roja no termina en la punta de la flecha roja). es decir, porque la flecha roja no termina en un variable ).

Not a Directed Acyclic Graph: tobacco smoke exposure causes increased mesothelioma risk; asbestos exposure causes increased mesothelioma risk; asbestos exposure causes an increase in the causal effect of tobacco on mesothelioma risk.

¿Cómo representar correctamente los efectos de interacción dentro del formalismo visual de un DAG?

Referencias

Greenland, S., Pearl, J., y Robins, J. M. (1999). Diagramas causales para la investigación epidemiológica . Epidemiología , 10(1):37-48.

24voto

Noah Puntos 85

La respuesta sencilla es que ya lo hace. Los DAG convencionales no sólo representan los efectos principales, sino más bien la combinación de efectos principales e interacciones. Una vez que ha trazado su DAG, ya asume que cualquier variable que apunte al mismo resultado puede modificar el efecto de las demás que apuntan al mismo resultado. Se trata de un supuesto de modelización, independiente del DAG, que presupone la ausencia de interacción.

Además, la interacción puede producirse sin incluir un término de interacción explícito en el modelo. Si sólo se incluyen efectos principales en un modelo para la razón de riesgo de Y con respecto al tratamiento T y la covariable Q, la estimación de la diferencia de riesgo diferirá dependiendo del nivel de Q. Para acomodar todas estas posibilidades de forma no paramétrica, los DAG sólo hacen las suposiciones más débiles sobre la forma funcional de las relaciones entre las variables, y suponer que no hay interacción es una suposición más fuerte que permitir una interacción. Esto también quiere decir que los DAG ya permiten la interacción sin ningún ajuste. Véase Vanderweele (2009) para un análisis de la interacción que utiliza DAG convencionales pero permite la interacción.

Bollen y Paxton (1998) y Muthén y Asparouhov (2015) demuestran interacciones en modelos de trayectoria con variables latentes, pero estas interacciones se refieren explícitamente a términos de producto en un modelo paramétrico en lugar de a interacciones en sentido amplio. También he visto diagramas similares al suyo en los que la flecha causal apunta a un camino, pero estrictamente hablando un camino no es una cantidad única sobre la que una variable pueda tener un efecto causal (aunque así sea como queramos interpretar nuestros modelos); simplemente representa la presencia de un efecto causal, no su magnitud.


Bollen, K. A., y Paxton, P. (1998). Interacciones de variables latentes en modelos de ecuaciones estructurales. Modelización de ecuaciones estructurales: A Multidisciplinary Journal , 5(3), 267-293.

Asparouhov, T. & Muthén, B. (2020): Estimación bayesiana de modelos uninivel y multinivel con interacciones de variables latentes , Modelización de ecuaciones estructurales: A Multidisciplinary Journal

VanderWeele, T. J. (2009). Sobre la distinción entre interacción y modificación del efecto . Epidemiología , 20(6), 863-871.

15voto

metaleap Puntos 121

La teoría de la causalidad de Pearl es completamente no paramétrico . Las interacciones no se hacen explícitas por ello, ni en el gráfico ni en las ecuaciones estructurales que representa. Sin embargo, los efectos causales pueden variar (mucho) según el supuesto.

Si se identifica un efecto y se estima a partir de los datos de forma no paramétrica, se obtiene una distribución completa de los efectos causales (en lugar de, por ejemplo, un único parámetro). En consecuencia, puede evaluar el efecto causal de la exposición al tabaco condicionada a la exposición al amianto de forma no paramétrica para ver si cambia, sin comprometerse con ninguna forma funcional.

Echemos un vistazo a las ecuaciones estructurales en su caso, que corresponden a su "DAG" despojado de la flecha roja:

Mesotelioma = $f_{1}$ (Tabaco, Amianto, $\epsilon_{m}$ )

Tabaco = $f_{2}$ ( $\epsilon_{t}$ )

Amianto = $f_{3}$ ( $\epsilon_{a}$ )

donde el $\epsilon$ se suponen independientes debido a la ausencia de flechas discontinuas entre ellos.

Hemos dejado sin especificar las respectivas funciones f() y las distribuciones de los errores, salvo para decir que estas últimas son independientes. No obstante, podemos aplicar la teoría de Pearl y afirmar inmediatamente que los efectos causales tanto de la exposición al tabaco como al amianto sobre el mesotelioma son identificado . Esto significa que si tuviéramos infinitas observaciones de este proceso, podríamos medir exactamente el efecto de ajuste las exposiciones a diferentes niveles simplemente ver la incidencia del mesotelioma en individuos con distintos niveles de exposición. Así que podríamos inferir la causalidad sin hacer un experimento real. Esto se debe a que no existen vías de retorno desde las variables de exposición a la variable de resultado.

Así que obtendrías

P(mesotelioma | do(Tabaco = t)) = P(mesotelioma | Tabaco = t)

La misma lógica se aplica al efecto causal del amianto, que permite evaluar de forma sencilla:

P(mesotelioma | Tabaco = t, Amianto = a) - P(mesotelioma | Tabaco = t', Amianto = a)

en comparación con

P(mesotelioma | Tabaco = t, Amianto = a') - P(mesotelioma | Tabaco = t', Amianto = a')

para todos los valores relevantes de t y a con el fin de estimar los efectos de interacción.

En su ejemplo concreto, supongamos que la variable de resultado es una variable de Bernoulli -se puede tener mesotelioma o no- y que una persona ha estado expuesta a un nivel de amianto a muy alto. Entonces, es muy probable que padezca mesotelioma; en consecuencia, el efecto de aumentar la exposición al tabaco será muy bajo. Por otro lado, si los niveles de amianto a' son muy bajos, el aumento de la exposición al tabaco tendrá un efecto mayor. Esto constituiría una interacción entre los efectos del tabaco y del amianto.

Por supuesto, la estimación no paramétrica puede ser extremadamente exigente y ruidosa con datos finitos y muchos valores diferentes de t y a, por lo que podría pensar en asumir alguna estructura en f(). Pero básicamente se puede hacer sin eso.

0voto

Nizamudeen Sherif Puntos 151

Si desea estimar directamente las ecuaciones estructurales no lineales no separables, existe una creciente literatura econométrica al respecto. Por supuesto, es necesario hacer algunas suposiciones para garantizar la identificación estadística (incluso si se ha construido un caso defendible para la identificación causal utilizando criterios gráficos y cálculo causal), pero no son tan restrictivas como en el caso lineal o paramétrico no lineal. Tenga en cuenta que la regresión cuantílica no paramétrica es equivalente a un modelo no separable bajo ciertas condiciones, por lo que le ofrece una opción de implementación bastante factible.

Breunig, C. (2020). Specification Testing in Nonparametric Instrumental Quantile Regression. Econometric Theory. https://doi.org/10.1017/S0266466619000288

Dunker, F. (16 de abril de 2020). Nonparametric instrumental variable regression and quantile regression with full independence. Repositorio arXiv. https://arxiv.org/pdf/1511.03977.pdf

Chernozhukov, V., Fernández-Val, I., Newey, W., Stouli, S., & Vella, F. (2020). Semiparametric Estimation of Structural Functions in Nonseparable Triangular Models. Quantitative Economics, 11, 503-633. https://qeconomics.org/ojs/index.php/qe/article/viewFile/1328/1320

Babii, A., & Florens, S.P. (30 de enero de 2020). ¿Son separables las variables inobservables? Repositorio arXiv. http://arxiv.org/pdf/1705.01654

Su, L., Tu, Y., & Ullah, A. (2015). Testing Additive Separability of Error Term in Nonparametric Structural Models. Econometric Reviews, 34(6-10), 1057-1088. https://doi.org/10.1080/07474938.2014.956621

Lu, X., y White, H. (2014). Testing for separability in structural equations. Journal of Econometrics, 182(1), 14-26. https://doi.org/10.1016/j.jeconom.2014.04.005

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X