29 votos

¿Existe alguna teoría o campo de estudio que se preocupe por modelar la causalidad en lugar de la correlación?

Mi entendimiento es que la probabilidad (al menos desde un punto de vista frecuentista) es una herramienta matemática para modelar correlaciones. Entonces, por ejemplo, podemos decir que dos eventos $X$ y $Y$ se definen como independientes si $P(X\cap Y) = P(X)P(Y)$, o equivalentemente $P(X|Y) = P(X)$, y así sucesivamente. Sin embargo, algo como si $P(X|Y) = P(X)$ nos dice nada acerca de la causalidad. Esto me lleva a la pregunta sobre la que trata este post.

¿Existe algún tipo de teoría o campo matemático de estudio que se ocupe de modelar la causalidad?

Sospecho que hay respuestas en dos formas posibles. La primera es que podría haber modelos especializados específicos para un determinado dominio de estudio (biología, física, economía). La segunda podría ser alguna teoría abstracta generalizada similar a la teoría de los constructores que honestamente solo se le ocurriría a un matemático.

Se agradecería una respuesta en cualquier forma posible.

40voto

B.Liu Puntos 289

Existen dos enfoques principales para la Nueva Revolución Causal. Uno es el enfoque gráfico (como en, grafos dirigidos acíclicos), liderado por Judea Pearl. El otro es el marco de resultados potenciales, liderado por Donald Rubin.

Para el enfoque gráfico, recomiendo estos libros en este orden:

  1. El libro del por qué, de Pearl and MacKenzie. Prerrequisito: estadística introductoria.
  2. Inferencia causal en estadística: una introducción, de Pearl, Glymour y Jewell. Prerrequisitos: la secuencia completa de cálculo, seguida por estadística matemática.
  3. Causalidad: Modelos, Razonamiento e Inferencia, 2da Ed., de Pearl. Este libro es extremadamente difícil (no lo he leído, aunque he ojeado partes de él) pero tiene casi todo lo necesario. Un desarrollo reciente no incluido en este libro es el enfoque de grafo de ancestros máximos. Prerrequisitos: primero estadística matemática, luego estadística bayesiana (recomendaría primero Estadística bayesiana para principiantes: un enfoque paso a paso y luego Introducción a la estadística bayesiana, 3ra Ed.; y finalmente redes bayesianas). El libro de Pearl tiene conjuntos de ejercicios acompañantes en la página web de Pearl: ir a CAUSALIDAD, luego 7. Diapositivas y tareas para instructores. De hecho, la página web de UCLA tiene erratas para los tres libros mencionados anteriormente.

Para el marco de resultados potenciales, el libro principal parece ser Inferencia causal para estadísticas, ciencias sociales y biomédicas: una introducción, de Rubin and Imbens. No lo he leído; pero los prerrequisitos parecen ser al menos estadística matemática - análisis y diseño de experimentos no vendrían mal, ni tampoco estadística bayesiana (ver #3 arriba para recomendaciones). Una debilidad de este libro es que no tiene ejercicios ni página de erratas.

Los dos enfoques tienen fortalezas y debilidades diferentes, pero como señaló Carlos en su comentario, están teóricamente unificados a través del Modelado Causal Estructural - abordado en varios de los libros anteriores.

21voto

Aaron Puntos 36

La inferencia causal es una parte de la inferencia estadística, por lo tanto se encuentra dentro del campo de la estadística. La inferencia causal generalmente requiere la inferencia de asociaciones estadísticas dentro de una estructura experimental adecuada que limita las asociaciones estadísticas a ciertas estructuras. Esto se aborda en libros especializados que examinan la interacción entre causalidad y probabilidad, especialmente en las excelentes obras de Judea Pearl (ver, por ejemplo, Pearl 2009, Pearl 2015, y Pearl, Glymour and Jewell 2016) y el marco de resultados potenciales de Donald Rubin (ver, por ejemplo, Holland 1986, Rubin 1991, Rubin 2005). Pearl ha criticado a la profesión estadística por prestar insuficiente atención a este material (ver pregunta relacionada aquí), pero sus obras siguen siendo parte del campo de la estadística y pueden considerarse correctamente como contribuciones en la interfaz de probabilidad, causalidad y estadística.

Como verás al leer estos trabajos, es posible mejorar la teoría de probabilidad tradicional al agregar un operador que represente una acción/intervención en el sistema (llamado el operador "hacer"), lo que permite incorporar la causalidad en el análisis a nivel axiomático. Esta es una extensión útil de la teoría de probabilidad tradicional. Actualmente, el plan de estudios de estadística para los estudiantes no incorpora mucho de este material, excepto en algunas clases especializadas que se imparten hacia el final del programa. Mi esperanza es que esta extensión a la teoría de probabilidad eventualmente se integre de manera más cohesiva en el plan de estudios de estadística, para que los estudiantes adquieran fluidez en el razonamiento causal desde una etapa temprana en sus estudios estadísticos, en lugar de verlo como un añadido que solo encuentran más tarde en su carrera.

13voto

ColorStatistics Puntos 110

Adrian Keister proporcionó una gran respuesta. Mi respuesta continúa la suya. Me tomó un tiempo darme cuenta de que los 2 enfoques diferentes para la inferencia causal (enfoque gráfico y resultados potenciales) son complementarios. Para tener la mejor apreciación de cómo estos 2 enfoques para la inferencia causal trabajan juntos, recomendaría leer Morgan & Winship "Contrafactuales e Inferencia Causal". De este libro aprenderá que hay 3 formas principales de estimar efectos causales: 1) criterio de puerta trasera, 2) variables instrumentales y 3) criterio de puerta delantera.

Aunque hay 3 métodos, la abrumadora mayoría de artículos de revistas de inferencia causal en econometría y ciencias sociales utilizan el método #2: variables instrumentales. Curiosamente, para el enfoque de variables instrumentales el DAG es en muchos aspectos innecesario porque siempre tiene el mismo esqueleto y puede ser fácilmente descrito con palabras. Se podría decir que para las VI un DAG es crucial; sí, lo es porque debe verse como el que se muestra a continuación (Z es el instrumento). Pero dado que todos los DAG de VI deben lucir así, ¿qué tan crucial es el DAG en VI y qué papel juega además de ser una bonita visualización? introducir descripción de la imagen aquí Un DAG es crucial para el método #1: criterio de puerta trasera. Pero en la práctica, es difícil argumentar convincentemente que se ha construido un DAG adecuado. En econometría o ciencias sociales difícilmente encontrarás un artículo de revista que utilice este método. Y si lo encuentras, es casi seguro que no contendrá un DAG. Por lo que he visto, este método se utiliza con éxito con bastante frecuencia en el campo médico. Para el criterio de puerta delantera del método #3, el DAG suele ser relativamente simple, con solo un par de caminos de puerta delantera, por lo que se puede describir fácilmente con palabras. Así que, al final del día, el enfoque gráfico es un buen complemento pero a menos que estés estimando efectos causales utilizando el criterio de puerta trasera (lo cual encuentro raro fuera del campo médico) o con un elaborado criterio de puerta delantera (también relativamente raro) un DAG no es crucial. En contraste, el marco de resultados potenciales subyace a la sustancia misma de la inferencia causal y, francamente, ni siquiera puedes definir la inferencia causal sin él. Los 2 libros de Angrist y Pischke son algo ambiguamente la mejor introducción al enfoque de resultados potenciales (en econometría y ciencias sociales); el libro de Hernan y Robins parece ser muy valorado también, especialmente en el campo de la salud pública/medicina (pero no lo he leído completo). Lo que considero la contribución más valiosa del campo de enfoque gráfico es crear conciencia sobre las variables de colisión; algunas de sus implicaciones (por ej. sesgo de selección endógeno) son consideraciones críticas y principales en la inferencia causal en diversas disciplinas.

Mis recursos favoritos:

(crédito del diagrama: https://donskerclass.github.io/EconometricsII/ControlandIV.html)

2voto

Jorg B Jorge Puntos 246

Respuesta simple. Sí, el método científico está ahí para ayudar a ENCONTRAR y confirmar las relaciones causales. Requiere una hipótesis, luego un experimento controlado, luego una conclusión (estadísticamente verificada). A medida que se recopilan datos para respaldar la hipótesis, se vuelve más y más cierto que "x" causa "y".

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X