43 votos

La correlación no implica causalidad, pero ¿qué ocurre cuando una de las variables es el tiempo?

Sé que esta pregunta se ha hecho mil millones de veces, así que, después de buscar en Internet, estoy plenamente convencido de que la correlación entre 2 variables no implica causalidad. En una de mis clases de estadística de hoy, un físico nos ha invitado a dar una conferencia sobre la importancia de los métodos estadísticos en la física. Ha hecho una afirmación asombrosa:

la correlación no implica causalidad, A MENOS QUE una de las variables sea el tiempo. Por lo tanto, si existe una fuerte correlación entre alguna variable independiente y el tiempo, esto también implica causalidad.

Nunca había oído esta afirmación. ¿Los físicos/relativistas ven la "Causalidad" de forma diferente a la gente de las estadísticas?

13 votos

Se trata de una afirmación vaga y probablemente falsa. El tiempo no causa casi nada, salvo la desintegración radiactiva. El vocabulario tiende a mejorar con la edad, pero todo depende de la socialización y la educación. ¿Puede describir el contexto y el problema en el que se afirma esta afirmación?

0 votos

@AdamO Las condiciones para la causalidad son más sencillos cuando se conoce la precedencia temporal, pero no son tan simples como en esta pregunta.

2 votos

Casi suena como si estuvieran describiendo Causalidad de Granger .

37voto

Voy a dar otra respuesta, ya que creo que las que se han dado hasta ahora pasan por alto un punto importante de la afirmación que hizo el físico. La afirmación citada es:

"correlación" no implica causalidad, A MENOS QUE una de las variables sea el tiempo. Por lo tanto, si existe una fuerte correlación entre alguna variable independiente y el tiempo, esto implica también causalidad."

El físico es no diciendo:

"Si X e Y están correlacionados, y X es anterior a Y, entonces la correlación implica causalidad".

Eso sería incorrecto. Lo que el físico es diciendo es:

"Si X y tiempo están correlacionadas, entonces esa correlación implica que el aumento del tiempo causa un aumento (o disminución) de X".

Un ejemplo podría ser la entropía. Si tenemos una fuerte correlación entre el paso del tiempo y el aumento de la entropía, entonces podríamos decir que el aumento del tiempo provoca un aumento de la entropía. Nótese que esto ignora cuáles podrían ser las causas físicas del aumento de entropía (desintegración de partículas, universo en expansión, etc.).

Uno de los requisitos tradicionales de la causalidad es la progresión temporal, es decir, que X sólo puede causar Y si X es anterior a Y. Pero si una de tus variables ES el tiempo, entonces la progresión temporal ya está incorporada en la relación (si es que existe una relación).

EDIT: Basándome en diversos comentarios, voy a añadir lo siguiente. Creo que el físico puede estar utilizando aquí una idea diferente de la palabra "causalidad". Parece decir que si existe una correlación entre una variable independiente y el tiempo, se puede concluir que la variable independiente cambia de forma predecible a medida que pasa el tiempo. Algunas personas podrían decir que los cambios son "causados" por el paso del tiempo, pero en realidad no es así como los estadísticos utilizan las palabras "causa" o "causalidad", por lo que puede estar causando parte de la confusión.

3 votos

+1 Exactamente, así es como yo interpreté la declaración también (ver mis comentarios anteriores y respuesta)

5 votos

Si vas a hacer del tiempo una variable en tu modelo gráfico, entonces el tiempo no tiene causas y es la causa de todo. Por tanto, sugerir que el tiempo es la causa de algo concreto es una afirmación vacua, ya que el tiempo es la causa de todo.

1 votos

Estoy de acuerdo con Neil G en el sentido de que esto parece implicar que "el tiempo lo causa todo" en cierto sentido. Si el tiempo se ve de esta manera, ¿por qué cualquier correlación necesarios para inferir la causalidad? Si observamos un movimiento armónico (por ejemplo, la desviación de un péndulo) a lo largo del tiempo, de modo que tiene una pendiente media cero a lo largo del tiempo... ¿significaría esto que no puede ¿deducir que el péndulo es un "sistema dinámico"? (o la interpretación que se quiera dar a " $dt$ causa $dx$ ") [Nota dependencia es más general que la correlación].

15voto

andynormancx Puntos 234

No sabemos qué quiso decir el físico. Se siguen dos interpretaciones diferentes.


La afirmación de que $X$ precede $Y$ y estar correlacionado con $Y$ implica que $X$ causa $Y$ está mal. No es suficiente para $X$ y $Y$ ser dependiente aunque $X$ precede a $Y$ . Por ejemplo, $X$ y $Y$ pueden ser causadas por otra variable $W$ : $X \leftarrow W \rightarrow Y$ . O podría surgir un patrón aún más complicado: $X \leftarrow V \rightarrow Z \leftarrow W \rightarrow Y$ donde $Z$ se observa. Ahora $X$ y $Y$ son dependientes y no tienen una causa común, pero ninguna causa a la otra.

Sin embargo, la precedencia temporal simplifica enormemente las condiciones para afirmar una relación causal, que puedes encontrar en el libro de causalidad de Pearl, capítulo 2.7 "Criterios locales para las relaciones causales".

Una variable $X$ tiene una influencia causal en $Y$ i variable $Z$ y un contexto $S$ ambos antes de $X$ tal que:

  1. $(Z\; \not\perp\!\!\!\!\perp Y \mid S)$ ;
  2. $(Z \perp\!\!\perp Y \mid S \cup X)$

Esencialmente, (1) implica que $Z$ es una causa potencial de $Y$ dada la precedencia temporal, y (2) implica que $X$ es capaz de romper esa relación, lo que sólo puede ocurrir si $X$ causa $Y$ .

Esta condición es mucho más simple que la definición de Pearl para una causa genuina sin información temporal.


Otra posibilidad esbozada en algunas de las otras respuestas es que el físico quisiera decir que si $X$ es el paso del tiempo y está correlacionado con $Y$ entonces $X$ causa $Y$ . Esta afirmación es correcta, pero vacua, ya que el paso del tiempo es la causa de todas las demás variables, con lo que quiero decir que la estructura gráfica causal es así. Una estructura gráfica causal es un conjunto de afirmaciones sobre relaciones de independencia dadas observaciones e intervenciones.

2 votos

Como mencioné en los comentarios a la respuesta de GeoMatt22, no creo que la afirmación del físico tenga nada que ver con la precedencia.

2 votos

@RubenvanBergen Como ya expliqué en otra respuesta, esa interpretación es vacua. El tiempo lo causa todo.

0 votos

En su ejemplo $X \leftarrow V \rightarrow Z \leftarrow W \rightarrow Y$ , $X$ y $Y$ serían dependientes, pero no estarían correlacionadas (a menos que $V$ y $W$ se correlacionan a través de una conexión que no especificó).

10voto

Aksakal Puntos 11351

Especulo que su profesor invitado quería decir que en física las únicas correlaciones que sobreviven a la replicación son aquellas en las que existe una relación causal subyacente. La variable tiempo es una excepción porque es la única variable que no controla el físico. He aquí por qué.

En física solemos tratar con fenómenos y experimentos repetibles. De hecho, es casi un hecho que cualquier experimento es repetible, y puede ser replicado por usted en otro momento o por otros investigadores. Supongamos que observamos una muestra en la que $y_i,x_{ki}$ son observaciones de la variable de interés y variables independientes $x_k$ . Como he mencionado anteriormente controlamos totalmente las variables $x_{k}$ y podemos fijarles el valor que queramos.

Tu físico dice que en esta configuración no verás ninguna correlación $Corr[y,x_{k}]$ a menos que haya una relación causal. ¿Por qué? Porque otra persona o incluso usted mismo repetirá el experimento con cualquier combinación y secuencia de $x_{kj}$ y sólo las correlaciones con relaciones causales sobrevivirán a las réplicas de un experimento. Todas las demás correlaciones (espurias) desaparecerán una vez que recoja suficientes datos en todas las combinaciones posibles de un experimento.

Esta situación contrasta con la de las ciencias sociales y algunas aplicaciones empresariales, donde no se pueden hacer experimentos. Sólo se observa una secuencia del PIB de un país, y no se puede cambiar el desempleo manteniendo todo lo demás igual y observar las correlaciones.

Ahora bien, el tiempo es la única variable que un físico no puede controlar. Sólo hay un 1 de enero de 2017. No puede repetir este día. Puede repetir cualquier otra variable, pero no el tiempo. Es por eso que cuando se trata de tiempo ( no tiempo transcurrido o la edad), un físico está en el mismo barco que todos los demás: la correlación no implica causalidad para él.

5voto

GeoMatt22 Puntos 1290

No he oído esto antes, y sería no ser cierto según las concepciones de la causalidad con las que estoy familiarizado (aunque no soy físico).

Normalmente, para $X$ causar $Y$ es necesario que $X$ precede a $Y$ a tiempo. Así que si $Y$ precede a $X$ entonces no puede ser "causada" por $X$ independientemente de cualquier correlación. Además, $X$ precede $Y$ no es un suficiente condición para la causalidad (también independientemente de cualquier correlación).

1 votos

Creo que no has entendido lo que quería decir este físico. Creo que se referían a una situación en la que dos variables están correlacionadas entre sí, y una de estas variables es el tiempo. Estas asumiendo que ninguna de las dos variables es el tiempo, pero que donde entra el tiempo es que una variable precede a la otra.

3 votos

Intentaba indicar que el paso del tiempo suele ser necesario para que se produzca algún cambio en $Y$ ser "causada" por algo, sino una correlación de $Y_t$ vs. $t$ no se suele hablar de "causalidad" (una $\Delta{t}$ es necesario pero no suficiente). Mi intención era comunicar que no sabe si esto es lo que el físico quería decir o no. Imagino que un físico diría típicamente "la disminución del carbono 14 a través del tiempo es causada por ". desintegración radiactiva )" en lugar de "... causada por el paso del tiempo". (Aunque quizá " requiere paso del tiempo").

0 votos

@RubenvanBergen quizás el conferenciante intentaba expresar una versión simplificada de algo parecido a lo que Wikipedia parece llamar " estructura causal "? La correlación con el tiempo (a escalas suficientemente finas) implicaría diferenciabilidad en la "dirección temporal". Puede que lo esté interpretando mal, pero al hojear Wikipedia se deduce un uso similar al que he escrito más arriba: "estructura causal" define lo que significa "precede". Pero me sigue pareciendo "necesario pero no suficiente".

4voto

Johnny Puntos 151

No creo que el tiempo sea necesariamente único en esto, pero sin duda es un buen ejemplo. La cuestión es que, normalmente, si A y B están correlacionados, se puede suponer que existe alguna causalidad común, pero no se sabe si A causa B o B causa A, o quizá una tercera variable C causa tanto A como B. Sin embargo, en ciertos casos, se puede descartar que cualquier otra variable causó A, por lo que debe ser que A causó B. Un ejemplo de ello es un experimento controlado, en el que usted Entonces, si el cambio que haces en A se "correlaciona" con un cambio en B, sabrás que ha sido A el que ha provocado el cambio en B, y no al revés.

Otro tipo de escenario, que es en el que cae este ejemplo con el tiempo, es si simplemente conozca que ninguna otra variable podría haber causado A porque sabes que nada en absoluto puede influir en A. Dado que el tiempo fluye de un segundo a la vez independientemente de cualquier otra variable en el mundo, entonces si el tiempo se correlaciona con los cambios en alguna variable que te interesa (por ejemplo, el número de personas en el planeta), sabes con certeza que el paso del tiempo debe haber causado que esa variable cambie, en lugar de que tu variable cause que el tiempo pase o cambie de otra manera (es decir, el tiempo no avanzó porque nacieron más personas, tiene que ser al revés).

Lo que sigue sin saberse, por supuesto, es si la causalidad es directa. Es de suponer que el paso del tiempo no produce automáticamente más seres humanos. Más bien, el desarrollo de la historia provoca el progreso en diversos aspectos de la sociedad, y esto hace que la población aumente de tamaño (e incluso esto es una simplificación de muchas pequeñas relaciones causales). Pero independientemente de los factores precisos que intervengan, lo que está claro es que A (en última instancia) conduce a B y no al revés.

0 votos

En tu primer párrafo, tus tres casos no son exhaustivos. Existen otras estructuras gráficas compatibles con la correlación.

0 votos

El descarte de todas las demás variables que causan $A$ no es posible para ningún problema realista. Existe un método por el cual se descarta un flujo de información a través de causas de $A$ que conducen a $B$ que se denomina método de puerta trasera . Esto puede establecer la causalidad.

1 votos

Como dije en otra respuesta, la idea de interpretar "el paso del tiempo" como variable y pretender que debe ser la causa de alguna otra variable es vacua. Esta variable temporal es la causa de todo.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X