Si dos variables tienen correlación 0, ¿por qué no son necesariamente independientes? ¿Son independientes las variables con correlación cero en circunstancias especiales? Si es posible, busco una explicación intuitiva, no una muy técnica.
Respuesta
¿Demasiados anuncios?Añadiendo a @Marcelo Ventura y @Mike Hunter grandes respuestas, y la referencia a un gran discusión en torno a esto en Quora.
Un punto importante (implícito) se hace aquí y en el hilo de quora. Aunque la correlación es una medida lineal, no significa exclusivamente que sólo pueda cuantificar la relación entre variables linealmente dependientes.
Podría decirse que un factor igualmente importante es si existe una relación monótona entre variables . Como se indica en minitab
En una relación monótona, las variables tienden a moverse en la misma dirección relativa, pero no necesariamente a un ritmo constante. En una relación lineal, las variables se mueven en la misma dirección a un ritmo constante.
Esto significa que si tenemos variables no monótonas relacionadas podemos observar una correlación nula aunque no sean independientes
Para ilustrar esto digamos que por ejemplo tenemos un $f(x) = x^2$ , utilizando python
para evaluar la función
Si nos fijamos en $x$ en $[0, 50)$ encontramos que $f(x)$ tiene una relación monótona con $x$ Como resultado, observamos que las correlaciones son cercanas a 1:
import numpy as np
import seaborn as sns
x = np.arange(0, 50, 1)
f = lambda x: x ** 2
y = f(x)
sns.scatterplot(x, y)
# Get correlations using scipy
from scipy.stats import pearsonr, spearmanr
pearsonr(x, y)[0]
spearmanr(x, y)[0]
- Correlación de Pearson:
0.967
- Correlación de Spearman:
0.999...
Ahora bien, si miramos $x$ en $[-25, 25)$ encontramos $f(x)$ ya no tiene un tono monótono relación con $x$ Por lo tanto, las correlaciones son cercanas a cero, como se esperaba:
x = np.arange(-25, 25, 1)
y = f(x)
sns.scatterplot(x, y)
pearsonr(x, y)[0]
spearmanr(x, y)[0]
- Correlación de Pearson:
-0.077
- Correlación de Spearman:
-0.059
- Ver respuestas anteriores
- Ver más respuestas
14 votos
La correlación es una medida de dependencia lineal (asociación). Es posible que dos variables aleatorias no estén correlacionadas pero sean no linealmente dependientes.
1 votos
Explicación intuitiva -> math.stackexchange.com/questions/444408/
6 votos
La correlación cero implica la independencia si las variables son normales multivariantes. Esto no es lo mismo que cada variable sea normal - véase aquí para algunos diagramas de dispersión de variables normales dependientes pero correlacionadas con cero (cada variable es individualmente normal)
1 votos
La correlación (no calificada) podría incluir la correlación de rangos, etc., para la cual la dependencia monótona es la cuestión, y así sucesivamente.
1 votos
Para el panorama, te recomendaría ver en Wikipedia la "correlación de distancia" como medida de independencia.
0 votos
Covarianza e independencia es un casi duplicado de esta pregunta, y algo que se acerca más a "¿Son independientes las variables con correlación cero en circunstancias especiales?" podría ser ¿Para qué distribuciones la falta de correlación implica independencia? o ¿La falta de correlación implica independencia bajo alguna condición? De forma más general, véase ¿Cuál es la relación entre ortogonalidad, correlación e independencia?
0 votos
Relacionado: stats.stackexchange.com/q/85363/119261