11 votos

Ejemplos de la vida real de la diferencia entre independencia y correlación

Es bien sabido que la independencia de variables aleatorias implica correlación cero pero correlation cero no implica independencia.

Me topé con muchos ejemplos matemáticos que demuestran dependencia a pesar de tener correlación cero. ¿Existen ejemplos en la vida real que respalden este hecho?

2 votos

Ten cuidado, solo la correlación cero y variables conjuntamente normales implican independencia.

0 votos

Longitud y volumen del cubo, no son independientes ya que el volumen = (longitud)^3. Pero como el volumen no es una función lineal de la longitud, no están correlacionados.

2 votos

@Siddesh "Pero como el volumen no es una función lineal de la longitud, no están correlacionados". Bueno, no correlacionados perfectamente. Pero estarían correlacionados positivamente.

5voto

Doug Kavendek Puntos 1244

El rendimiento de las acciones es un buen ejemplo de la vida real de lo que estás preguntando. Hay una correlación muy cercana a cero entre el rendimiento del S&P 500 de hoy y el de ayer. Sin embargo, hay una clara dependencia: los rendimientos al cuadrado son positivamente autocorrelacionados; los períodos de alta volatilidad se agrupan en el tiempo.

Código R:

library(ggplot2)
library(grid)
library(quantmod)

symbols   <- new.env()
date_from <- as.Date("1960-01-01")
date_to   <- as.Date("2016-02-01")
getSymbols("^GSPC", env=symbols, src="yahoo", from=date_from, to=date_to)  # S&P500

df <- data.frame(close=as.numeric(symbols$GSPC$GSPC.Close),
                 date=index(symbols$GSPC))
df$log_return     <- c(NA, diff(log(df$close)))
df$log_return_lag <- c(NA, head(df$log_return, nrow(df) - 1))

cor(df$log_return,   df$log_return_lag,   use="pairwise.complete.obs")  # 0.02
cor(df$log_return^2, df$log_return_lag^2, use="pairwise.complete.obs")  # 0.14

acf(df$log_return,     na.action=na.pass)  # Básicamente cero autocorrelación
acf((df$log_return^2), na.action=na.pass)  # Rendimientos al cuadrado positivamente autocorrelacionados

p <- (ggplot(df, aes(x=date, y=log_return)) +
      geom_point(alpha=0.5) +
      theme_bw() + theme(panel.border=element_blank()))
p
ggsave("log_returns_s&p.png", p, width=10, height=8)

La serie temporal de los rendimientos logarítmicos en el S&P 500:

serie temporal de los rendimientos logarítmicos

Si los rendimientos fueran independientes a lo largo del tiempo (y estacionarios), sería muy improbable ver esos patrones de volatilidad agrupada, y no verías autocorrelación en los rendimientos logarítmicos al cuadrado.

4voto

Zizzencs Puntos 1358

Otro ejemplo es la relación entre el estrés y las calificaciones en un examen. La relación es en forma de U inversa y la correlación es muy baja a pesar de que la causalidad parece bastante clara.

2 votos

Ese es un buen ejemplo. ¿Tienes datos o es solo basado en introspección / experiencia docente?

1 votos

Vi un estudio sobre esto, pero fue hace muchos años, así que no tengo la cita ni los datos reales.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X