57 votos

Por qué la correlación cero no implica necesariamente la independencia

Si dos variables tienen correlación 0, ¿por qué no son necesariamente independientes? ¿Son independientes las variables con correlación cero en circunstancias especiales? Si es posible, busco una explicación intuitiva, no una muy técnica.

14 votos

La correlación es una medida de dependencia lineal (asociación). Es posible que dos variables aleatorias no estén correlacionadas pero sean no linealmente dependientes.

1 votos

Explicación intuitiva -> math.stackexchange.com/questions/444408/

6 votos

La correlación cero implica la independencia si las variables son normales multivariantes. Esto no es lo mismo que cada variable sea normal - véase aquí para algunos diagramas de dispersión de variables normales dependientes pero correlacionadas con cero (cada variable es individualmente normal)

2voto

Kenneth Calcutt Puntos 11

Añadiendo a @Marcelo Ventura y @Mike Hunter grandes respuestas, y la referencia a un gran discusión en torno a esto en Quora.

Un punto importante (implícito) se hace aquí y en el hilo de quora. Aunque la correlación es una medida lineal, no significa exclusivamente que sólo pueda cuantificar la relación entre variables linealmente dependientes.

Podría decirse que un factor igualmente importante es si existe una relación monótona entre variables . Como se indica en minitab

En una relación monótona, las variables tienden a moverse en la misma dirección relativa, pero no necesariamente a un ritmo constante. En una relación lineal, las variables se mueven en la misma dirección a un ritmo constante.

Esto significa que si tenemos variables no monótonas relacionadas podemos observar una correlación nula aunque no sean independientes

Para ilustrar esto digamos que por ejemplo tenemos un $f(x) = x^2$ , utilizando python para evaluar la función

Si nos fijamos en $x$ en $[0, 50)$ encontramos que $f(x)$ tiene una relación monótona con $x$ Como resultado, observamos que las correlaciones son cercanas a 1:

import numpy as np
import seaborn as sns

x = np.arange(0, 50, 1)
f = lambda x: x ** 2
y = f(x)
sns.scatterplot(x, y)

enter image description here

# Get correlations using scipy
from scipy.stats import pearsonr, spearmanr
pearsonr(x, y)[0]
spearmanr(x, y)[0]
  • Correlación de Pearson: 0.967
  • Correlación de Spearman: 0.999...

Ahora bien, si miramos $x$ en $[-25, 25)$ encontramos $f(x)$ ya no tiene un tono monótono relación con $x$ Por lo tanto, las correlaciones son cercanas a cero, como se esperaba:

x = np.arange(-25, 25, 1)
y = f(x)
sns.scatterplot(x, y)
pearsonr(x, y)[0]
spearmanr(x, y)[0]

enter image description here

  • Correlación de Pearson: -0.077
  • Correlación de Spearman: -0.059

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X