6 votos

$cor(B_1,Y) > cor(B_2,Y) > 0$ pero $cor(A + B_1, A+Y) < cor(A + B_2, A+Y)$ . ¿Es esto posible?

Cuando estaba procesando datos me encontré con este extraño fenómeno. Digamos que tengo series de tiempo con valores positivos solamente, $A, B_1, B_2, Y.$ $\operatorname{cor}(X,Y)$ es la correlación de $X,Y.$

Aquí tengo $\operatorname{cor}(B_1,Y) > \operatorname{cor}(B_2,Y) > 0$ . Agrego $B_1, B_2, Y$ a $A$ . Pero entonces observo que $\operatorname{cor}(A + B_1, A+Y) < \operatorname{cor}(A + B_2, A+Y)$ .

¿Es posible? ¿O hay algunos problemas en mis datos que tengo que investigar?

5voto

jldugger Puntos 7490

Como la correlación no dice nada sobre las magnitudes de las variables, se puede invertir su orden relativo ajustando las magnitudes convenientemente.

Aquí, por ejemplo, hay una matriz de dispersión de algunos $(Y, B_1, B_2)$ datos:

Figure 0

Claramente $Y$ está más correlacionado con $B_1$ que con $B_2.$

Para ayudarnos a apreciar la variación de las magnitudes, he aquí los mismos datos mostrados utilizando escalas comunes en todos los ejes:

Figure 1

Los coeficientes de correlación entre $Y$ y el $B_i$ son $0.88\gt 0.67.$

Elección de $A=Y,$ aquí hay una matriz de dispersión de las nuevas variables también en escalas comunes:

Figure 2

Aquí tienes algunos detalles:

Figure 3

Los coeficientes de correlación entre $A+Y$ y el $A+B_i$ son $0.944 \lt 0.996:$ ahora este último es mayor que el primero, invirtiendo la relación original.


Si quieres experimentar con conjuntos de datos similares, aquí tienes el R código utilizado para generarlas, junto con los cálculos de las correlaciones. Sepa que runif genera un número especificado de variantes uniformes iid dentro del rango de valores especificado por su segundo y tercer argumento; todas las operaciones aritméticas son operaciones vectoriales (suma de vectores y multiplicación escalar).

n <- 1e2

Y <- runif(n, 1, 2)
B.1 <- 2 * Y + runif(n, -1/2, 1/2)
B.2 <- (Y + runif(n, -1/2, 1/2)) / 10
A <- Y

cor(cbind(Y, B.1, B.2))
cor(cbind(A+Y, A+B.1, A+B.2))

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X