Loading [MathJax]/jax/element/mml/optable/Latin1Supplement.js

160 votos

¿La causalidad implica correlación?

La correlación no implica causalidad, ya que podría haber muchas explicaciones para la correlación. Pero ¿implica la causalidad correlación? Intuitivamente, yo pensaría que la presencia de causalidad significa que necesariamente hay alguna correlación. Pero mi intuición no siempre me ha servido bien en estadística. ¿Implica la causalidad correlación?

6 votos

El problema es que si buscas "imply" en un diccionario verás tanto "sugerir" como "necesitar".

8 votos

La correlación no implica causalidad, pero sí mueve las cejas sugestivamente y hace gestos furtivos mientras murmura 'mira hacia allá'. xkcd.com/552

1 votos

La pregunta en sí misma no parece estar buscando una respuesta específica y factual, como lo indica el uso de la palabra "implicar". La referencia anterior es como un tal vez definitivo. O más bien como un probable pero no puedo probarlo.

122voto

Ray Vega Puntos 30187

Tal como muchas de las respuestas anteriores han indicado, la causalidad no implica correlación lineal. Dado que muchos de los conceptos de correlación provienen de campos que dependen en gran medida de estadísticas lineales, generalmente se ve la correlación como igual a la correlación lineal. El artículo de wikipedia es una fuente aceptable para esto, realmente me gusta esta imagen:

Ejemplos de correlación

Observa algunas de las figuras en la fila inferior, por ejemplo la forma casi parabólica en el cuarto ejemplo. Esto es más o menos lo que sucede en la respuesta de @StasK (con un poco de ruido añadido). Y puede ser causado completamente por X, pero si la relación numérica no es lineal y simétrica, seguirás teniendo una correlación de 0.

La palabra que estás buscando es información mutua: esta es una especie de versión no lineal general de correlación. En ese caso, tu afirmación sería cierta: la causalidad implica alta información mutua.

3 votos

Por lo general, pero no siempre es verdad que una alta información mutua acompaña a la causalidad. Ver la respuesta de @gung donde "si la causa está perfectamente correlacionada con otra variable causal con exactamente el efecto opuesto.

6 votos

El argumento de dos causas con efectos opuestos que siempre se anulan entre sí no tiene mucho sentido para mí como causa. Siempre puedo asumir que hay unicornios causando algo, y gremlins cancelando sus esfuerzos perfectamente; evito esto ya que es absurdo. Pero tal vez estoy malinterpretando tu punto.

11 votos

Su ejemplo es más extremo de lo necesario. Es posible que tenga variables Booleanas A,B y C tales que A y B son causas de C, y C=A+B (mod 2). Luego, en ausencia de conocimiento de B, A y C no tienen información mutua. B es un confundidor no descubierto, lo que usted llama "duendes" aunque es algo muy común.

52voto

StasK Puntos 19497

La respuesta estricta es "no, la causalidad no implica necesariamente correlación".

Considere XN(0,1) y Y=X2χ21. La causalidad no puede ser más fuerte: X determina a Y. Sin embargo, la correlación entre X y Y es 0. Prueba: Los momentos (conjuntos) de estas variables son: E[X]=0; E[Y]=E[X2]=1; Cov[X,Y]=E[(X0)(Y1)]=E[XY]E[X]1=E[X3]E[X]=0 utilizando la propiedad de la distribución normal estándar de que todos sus momentos impares son iguales a cero (se pueden derivar fácilmente de su función generadora de momentos, por ejemplo). Por lo tanto, la correlación es igual a cero.

Para abordar algunos de los comentarios: la única razón por la que este argumento funciona es porque la distribución de X está centrada en cero y es simétrica alrededor de 0. De hecho, cualquier otra distribución con estas propiedades que tuviera un número suficiente de momentos habría funcionado en lugar de N(0,1), por ejemplo, uniforme en (10,10) o Laplace exp(|x|). Un argumento simplificado es que para cada valor positivo de X, hay un valor negativo de X de igual probabilidad del mismo tamaño, por lo que cuando se eleva al cuadrado el X, no se puede afirmar que los valores más grandes de X estén asociados con valores más grandes o más pequeños de Y. Sin embargo, si tomamos por ejemplo X\sim N(3,1), entonces E[X]=3, E[Y]=E[X^2]=10, E[X^3]=36, y {\rm Cov}[X,Y]=E[XY]-E[X]E[Y]=36-30=6\neq0. Esto tiene mucho sentido: para cada valor de X por debajo de cero, hay un valor mucho más probable de -X que está por encima de cero, por lo que los valores más grandes de X están asociados con valores más grandes de $Y. (Este último tiene una distribución \chi^2 no central; puede tomar la varianza de la página de Wikipedia y calcular la correlación si está interesado.)

0 votos

¿Podrías explicar más detalladamente por qué x e y no están correlacionados en este ejemplo (o proporcionar una referencia útil o una palabra clave que pueda usar para encontrar más información)? No me resulta inmediatamente evidente. gracias.

0 votos

Cuando tenga más tiempo, daré el argumento completo con los valores esperados, entonces.

2 votos

@DQdlM: La variable aleatoria estándar tiene momentos centrales impares que desaparecen, debido a la paridad de la densidad. Matthew: La respuesta es no, como StasK ha demostrado, porque la correlación no es el único tipo de dependencia.

34voto

Brettski Puntos 5485

Esencialmente, sí.

La correlación no implica causalidad porque podría haber otras explicaciones para una correlación más allá de la causa. Pero para que A sea causa de B deben estar asociados de alguna manera. Lo que significa que hay una correlación entre ellos, aunque esa correlación no necesariamente debe ser lineal.

Como algunos de los comentaristas han sugerido, probablemente sea más apropiado usar un término como 'dependencia' o 'asociación' en lugar de correlación. Aunque como he mencionado en los comentarios, he visto "la correlación no implica causalidad" como respuesta a análisis mucho más allá de la simple correlación lineal, y por lo tanto, para los propósitos de dicho refrán, he extendido esencialmente "correlación" a cualquier asociación entre A y B.

20 votos

Tiendo a reservar la palabra correlación para correlación lineal , y usar dependencia para relaciones no lineales que pueden o no tener correlación lineal.

4 votos

@Memming Yo también lo haría, salvo por el hecho de que la gente saca "La correlación no implica causalidad" en relación con una asociación bastante compleja y no lineal.

0 votos

Memming tiene razón. Necesitas definir la correlación si no te refieres a la correlación de Pearson.

24voto

Zizzencs Puntos 1358

Agregando a la respuesta de @EpiGrad. Creo que, para mucha gente, "correlación" implicará "correlación lineal". Y el concepto de correlación no lineal podría no ser intuitivo.

Por lo tanto, diría "no tienen que estar correlacionados pero sí tienen que estar relacionados". Estamos de acuerdo en el contenido, pero discrepamos en la mejor forma de transmitir el contenido.

Un ejemplo de tal causalidad (al menos la gente piensa que es causal) es la existente entre la probabilidad de contestar el teléfono e ingresos. Se sabe que las personas en ambos extremos del espectro de ingresos son menos propensas a contestar sus teléfonos que las personas en el medio. Se piensa que el patrón causal es diferente para los pobres (por ejemplo, evitar a los cobradores de facturas) y los ricos (por ejemplo, evitar a personas que piden donaciones).

13voto

Sean Hanley Puntos 2428

La causa y el efecto estarán correlacionados a menos que no haya ninguna variación en absoluto en la incidencia y magnitud de la causa y ninguna variación en absoluto en su fuerza causal. La única otra posibilidad sería si la causa está perfectamente correlacionada con otra variable causal con exactamente el efecto contrario. Básicamente, estas son condiciones para experimentos mentales. En el mundo real, la causalidad implicará dependencia en alguna forma (aunque podría no ser una correlación lineal).

0 votos

+1 por recordarnos la situación de equilibrio (que podría ser más común de lo que sugieres)

0 votos

Quise poner +1, pero por accidente le di a menos. ¿Puedes corregirlo?

0 votos

@NeilG, creo que simplemente puedes pulsar sobre el botón de arriba normal y se anulará el -1 accidental; alternativamente, quizás un moderador pueda hacerlo, desafortunadamente, yo no puedo anular/editar tu voto. Sin embargo, si se mantiene, estará bien; ningún problema, ningún perjuicio.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X