¿Cuál es la definición matemática de una relación causal entre dos variables aleatorias?
Matemáticamente, un modelo causal consiste en relaciones funcionales entre variables. Por ejemplo, considera el sistema de ecuaciones estructurales a continuación:
$$ x = f_x(\epsilon_{x})\\ y = f_y(x, \epsilon_{y}) $$
Esto significa que $x$ determina funcionalmente el valor de $y$ (si intervienes en $x$ esto cambia los valores de $y$) pero no al revés. Gráficamente, esto suele representarse como $x \rightarrow y$, lo que significa que $x$ entra en la ecuación estructural de y. Como complemento, también puedes expresar un modelo causal en términos de distribuciones conjuntas de variables contrafactuales, lo cual es matemáticamente equivalente a modelos funcionales.
Dada una muestra de la distribución conjunta de dos variables aleatorias X e Y, ¿cuándo podemos decir que X causa Y?
A veces (o la mayoría de las veces) no tienes conocimiento sobre la forma de las ecuaciones estructurales $f_{x}$, $f_y$, ni siquiera si $x\rightarrow y$ o $y \rightarrow x$. La única información que tienes es la distribución de probabilidad conjunta $p(y,x)$ (o muestras de esta distribución).
Esto lleva a tu pregunta: ¿cuándo puedo recuperar la dirección de causalidad solo a partir de los datos? O, más precisamente, ¿cuándo puedo recuperar si $x$ entra en la ecuación estructural de $y$ o viceversa, solo a partir de los datos?
Por supuesto, sin asunciones fundamentalmente incalificables sobre el modelo causal, esto es imposible. El problema es que varios modelos causales diferentes pueden resultar en la misma distribución de probabilidad conjunta de variables observadas. El ejemplo más común es un sistema causal lineal con ruido gaussiano.
Pero bajo algunas suposiciones causales, esto podría ser posible---y en eso trabaja la literatura de descubrimiento causal. Si no tienes exposición previa a este tema, podrías empezar por Elementos de Inferencia Causal de Peters, Janzing y Scholkopf, así como el capítulo 2 de Causalidad de Judea Pearl. Tenemos un tema aquí en CV sobre referencias de descubrimiento causal, pero aún no tenemos muchas referencias enumeradas allí.
Por lo tanto, no hay una sola respuesta a tu pregunta, ya que depende de las suposiciones que se hagan. El artículo que mencionas cita algunos ejemplos, como asumir un modelo lineal con ruido no gaussiano. Este caso se conoce como LINGAN (acrónimo de modelo acíclico lineal no gaussiano), aquí tienes un ejemplo en R
:
library(pcalg)
set.seed(1234)
n <- 500
eps1 <- sign(rnorm(n)) * sqrt(abs(rnorm(n)))
eps2 <- runif(n) - 0.5
x2 <- 3 + eps2
x1 <- 0.9*x2 + 7 + eps1
# corre lingam
X <- cbind(x1, x2)
res <- lingam(X)
as(res, "amat")
# Matriz de Adyacencia 'amat' (2 x 2) de tipo "pag":
# [,1] [,2]
# [1,] . .
# [2,] TRUE .
Observa aquí que tenemos un modelo causal lineal con ruido no gaussiano donde $x_2$ causa $x_1$ y lingam recupera correctamente la dirección causal. Sin embargo, ten en cuenta que esto depende críticamente de las suposiciones de LINGAM.
Para el caso del artículo que mencionas, hacen esta suposición específica (ver su "postulado"):
Si $x\rightarrow y$, la longitud mínima de la descripción del mecanismo que mapea X a Y es independiente del valor de X, mientras que la longitud mínima de la descripción del mecanismo que mapea Y a X depende del valor de Y.
Nota que esta es una suposición. Esto es lo que llamaríamos su "condición de identificación". Esencialmente, el postulado impone restricciones sobre la distribución conjunta $p(x,y)$. Es decir, el postulado dice que si $x \rightarrow y$ ciertas restricciones se cumplen en los datos, y si $y \rightarrow x$ otras restricciones se cumplen. Este tipo de restricciones que tienen implicaciones comprobables (imponen restricciones sobre $p(y,x)$) es lo que permite recuperar la dirección a partir de datos observacionales.
Como comentario final, los resultados de descubrimiento causal siguen siendo muy limitados y dependen de fuertes suposiciones, ten cuidado al aplicarlos en un contexto del mundo real.
2 votos
Según lo que puedo ver, la causalidad es un concepto científico y no matemático. ¿Puedes editar para clarificar?
3 votos
@mdewey No estoy de acuerdo. La causalidad puede ser analizada en términos completamente formales. Mira por ejemplo mi respuesta.