16 votos

¿Es posible que 3 vectores tengan todos correlaciones negativas por pares?

Dados tres vectores $a$ , $b$ y $c$ ¿es posible que las correlaciones entre $a$ y $b$ , $a$ y $c$ y $b$ y $c$ ¿son todos negativos? Es decir, ¿es esto posible?

\begin{align} \text{corr}(a,b) < 0\\ \text{corr}(a,c) < 0 \\ \text{corr}(b,c) < 0\\ \end{align}

3 votos

Las correlaciones negativas significan, geométricamente, que los vectores centrados forman mutuamente ángulos obtusos. No deberías tener problemas para dibujar una configuración de tres vectores en el plano que tengan esta propiedad.

0 votos

No pueden estar completamente correlacionados de forma negativa ( $\rho=-1$ ), pero en general puede haber alguna correlación negativa, de nuevo con los límites establecidos por las otras correlaciones.

0 votos

@karakfa Una pregunta interesante será, ¿cuál es la menor correlación posible que pueden tener los tres pares simultáneamente? Podrías añadir esto a tu respuesta más abajo.

19voto

Kendra Puntos 11

Es posible si el tamaño del vector es 3 o mayor. Por ejemplo

\begin{align} a &= (-1, 1, 1)\\ b &= (1, -9, -3)\\ c &= (2, 3, -1)\\ \end{align}

Las correlaciones son \begin{equation} \text{cor}(a,b) = -0.80...\\ \text{cor}(a,c) = -0.27...\\ \text{cor}(b,c) = -0.34... \end{equation}

Podemos demostrar que para vectores de tamaño 2 esto no es posible: \begin{align} \text{cor}(a,b) &< 0\\[5pt] 2\Big(\sum_i a_i b_i\Big) - \Big(\sum_i a_i\Big)\Big(\sum_i b_i\Big) &< 0\\[5pt] 2(a_1 b_1 + a_2 b_2) - (a_1 + a_2)(b_1 b_2) &< 0\\[5pt] 2(a_1 b_1 + a_2 b_2) - (a_1 + a_2)(b_1 b_2) &< 0\\[5pt] 2(a_1 b_1 + a_2 b_2) - a_1 b_1 + a_1 b_2 + a_2 b_1 + a_2 b_2 &< 0\\[5pt] a_1 b_1 + a_2 b_2 - a_1 b_2 + a_2 b_1 &< 0\\[5pt] a_1 (b_1-b_2) + a_2 (b_2-b_1) &< 0\\[5pt] (a_1-a_2)(b_1-b_2) &< 0 \end{align}

La fórmula tiene sentido: si $a_1$ es mayor que $a_2$ , $b_2$ tiene que ser mayor que $b_1$ para que la correlación sea negativa.

Del mismo modo, para las correlaciones entre (a,c) y (b,c) obtenemos

\begin{equation} (a_1-a_2)(c_1-c_2) < 0\\ (b_1-b_2)(c_1-c_2) < 0\\ \end{equation}

Es evidente que estas tres fórmulas no pueden mantenerse al mismo tiempo.

4 votos

Otro ejemplo de algo inesperado que sólo ocurre en la dimensión tres o superior.

2 votos

Con vectores de tamaño $2$ Las correlaciones suelen ser $\pm1$ (línea recta que pasa por dos puntos), y no se pueden tener tres correlaciones de $-1$ con tres vectores de cualquier tamaño

10voto

Romain Puntos 3062

Sí, pueden hacerlo.

Suponga que tiene una distribución normal multivariante $X\in R^3, X\sim N(0,\Sigma)$ . La única restricción en $\Sigma$ es que tiene que ser semidefinido positivo.

Así, tomemos el siguiente ejemplo $\Sigma = \begin{pmatrix} 1 & -0.2 & -0.2 \\ -0.2 & 1 & -0.2 \\ -0.2 & -0.2 & 1 \end{pmatrix} $

Sus valores propios son todos positivos (1,2, 1,2, 0,6), y puede crear vectores con correlación negativa.

8voto

Mariattta Puntos 8

Comencemos con una matriz de correlación para 3 variables

$\Sigma = \begin{pmatrix} 1 & p & q \\ p & 1 & r \\ q & r & 1 \end{pmatrix} $

la definición no negativa crea restricciones para las correlaciones entre pares $p,q,r$ que puede escribirse como

$$ pqr \ge \frac{p^2+q^2+r^2-1}2 $$

Por ejemplo, si $p=q=-1$ los valores de $r$ está restringido por $2r \ge r^2+1$ que obliga a $r=1$ . Por otro lado, si $p=q=-\frac12$ , $r$ puede estar dentro de $\frac{2 \pm \sqrt{3}}4$ gama.

Respondiendo a la interesante pregunta de seguimiento de @amoeba: "¿Cuál es la menor correlación posible que pueden tener los tres pares simultáneamente?"

Dejemos que $p=q=r=x < 0$ Encuentra la raíz más pequeña de $2x^3-3x^2+1$ que le dará $-\frac12$ . Tal vez no sea sorprendente para algunos.

Se puede hacer un argumento más fuerte si una de las correlaciones, digamos $r=-1$ . De la misma ecuación $-2pq \ge p^2+q^2$ podemos deducir que $p=-q$ . Por lo tanto, si dos correlaciones son $-1$ La tercera debería ser $1$ .

3 votos

Ver stats.stackexchange.com/questions/72790/ , entre otras cosas.

3voto

SarahC Puntos 6

Una simple función de R para explorar esto:

f <- function(n,trials = 10000){
  count <- 0
  for(i in 1:trials){
    a <- runif(n)
    b <- runif(n)
    c <- runif(n)
    if(cor(a,b) < 0 & cor(a,c) < 0 & cor(b,c) < 0){
      count <- count + 1
    }
  }
  count/trials
}

En función de n , f(n) comienza en 0, se hace distinto de cero en n = 3 (con valores típicos en torno a 0,06), y luego aumenta a alrededor de 0,11 por n = 15 después de lo cual parece estabilizarse:

enter image description here Por lo tanto, no sólo es posible que las tres correlaciones sean negativas, sino que no parece ser terriblemente infrecuente (al menos para distribuciones uniformes).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X