31 votos

Pregunta sobre la correlación entre tres variables

Hace poco me hicieron esta pregunta sobre la correlación y, aunque parece intuitiva, aún no he encontrado una respuesta satisfactoria. Espero que puedan ayudarme con esta pregunta aparentemente sencilla.

Supongamos que tengo tres variables aleatorias $A$ , $B$ , $C$ . ¿Es posible satisfacer estas tres relaciones? $$ \mathrm{corr}[A,B] = 0.9 $$ $$ \mathrm{corr}[B,C] = 0.8 $$ $$ \mathrm{corr}[A,C] = 0.1 $$ Mi intuición es que no es posible, aunque ahora mismo no veo cómo demostrarlo de forma concluyente.

31voto

Tony Saul Puntos 1

He aquí una respuesta a la pregunta general, que escribí hace un tiempo. Es una pregunta habitual en las entrevistas.

La pregunta es la siguiente: "Digamos que tienes X,Y,Z tres variables aleatorias tales que la correlación de X e Y es algo y la correlación de Y y Z es otra cosa, ¿cuáles son las posibles correlaciones para X y Z en términos de las otras dos correlaciones?".

Daremos una respuesta completa a esta pregunta, utilizando la desigualdad de Cauchy-Schwarz y el hecho de que $\mathcal{L}^2$ es un espacio de Hilbert.

La desigualdad de Cauchy-Schwarz dice que si x,y son dos vectores en un espacio de producto interior, entonces

$$\lvert\langle x,y\rangle\rvert \leq \sqrt{\langle x,x\rangle\langle y,y\rangle}$$

Esto se utiliza para justificar la noción de ''ángulo'' en espacios vectoriales abstractos, ya que da la restricción

$$-1 \leq \frac{\langle x,y\rangle}{\sqrt{\langle x,x\rangle\langle y,y\rangle}} \leq 1$$ lo que significa que podemos interpretarlo como el coseno del ángulo entre los vectores x e y.

Un espacio de Hilbert es un espacio vectorial de dimensión infinita con un producto interior. Lo importante para este post es que en un espacio de Hilbert el producto interior nos permite hacer geometría con los vectores, que en este caso son variables aleatorias. Daremos por supuesto que el espacio de variables aleatorias de media 0 y varianza 1 es un espacio de Hilbert, con producto interior $\mathbb{E}[XY]$ . Obsérvese que, en particular

$$\frac{\langle X,Y\rangle}{\sqrt{\langle X,X\rangle\langle Y,Y\rangle}} = \text{Cor}(X,Y)$$

Esto a menudo lleva a la gente a decir que "las correlaciones son cosenos", lo que es intuitivamente cierto, pero no formalmente correcto, ya que ciertamente no son los cosenos en los que pensamos naturalmente (este espacio es infinito dimensional), pero todas las leyes se mantienen (como el teorema de Pitágoras, la ley de los cosenos) si las definimos como el negativo de los cosenos del ángulo entre dos variables aleatorias, cuyas longitudes podemos considerar como sus desviaciones estándar en este espacio vectorial.

Como este espacio es un espacio de Hilbert, podemos hacer toda la geometría que hicimos en el instituto, como proyectar vectores unos sobre otros, hacer descomposición ortogonal, etc. Para resolver esta cuestión, utilizamos la descomposición ortogonal, que en estadística suele denominarse ''truco de la no correlación'' y consiste en escribir una variable aleatoria como función de otra variable aleatoria más una variable aleatoria que no esté correlacionada con la segunda variable aleatoria. Esto es especialmente útil en el caso de variables aleatorias normales multivariantes, cuando el hecho de que dos componentes no estén correlacionados implica independencia.

Bien, supongamos que sabemos que la correlación de X e Y es $p_{xy}$ la correlación de Y y Z es $p_{yz}$ y queremos conocer la correlación de X y Z, que llamaremos $p_{xz}$ . Nótese que no perdemos generalidad suponiendo media 0 y varianza 1, ya que escalar y trasladar los vectores no afecta a sus correlaciones. Podemos entonces escribir

$$X = \langle X,Y\rangle Y + O^X_Y$$

$$Z = \langle Z,Y\rangle Y + O^Z_Y$$

donde $\langle \cdot,\cdot\rangle$ representa el producto interior sobre el espacio y el $O$ no están correlacionadas con Y. A continuación, tomamos el producto interior de $X,Z$ que es la correlación que buscamos, ya que todo tiene varianza 1. Tenemos que

$$\langle X,Z\rangle = p_{xz} = \langle p_{xy}Y+O^X_Y,p_{zy}Y+O^Z_Y\rangle = p_{xy}p_{yz}+\langle O^X_Y,O^Z_Y\rangle$$

ya que la varianza de Y es 1 y los otros términos de esta expansión bilineal son ortogonales y por tanto tienen covarianza 0. Ahora podemos aplicar la desigualdad de Cauchy-Schwarz al último término anterior para obtener que

$$p_{x,z} \leq p_{xy}p_{yz} + \sqrt{(1-p_{x,y}^2)(1-p_{y,z}^2)}$$

$$p_{x,z} \geq p_{xy}p_{yz} - \sqrt{(1-p_{x,y}^2)(1-p_{y,z}^2)}$$

donde el hecho de que

$$\langle O^X_Y,O^X_Y\rangle = 1-p_{xy}^2$$

proviene de la ecuación que establece la varianza de X igual a 1 o

$$1 = \langle X,X\rangle = \langle p_{xy}Y + O^X_Y,p_{xy}Y+O^X_Y\rangle = p_{xy}^2 + \langle O^X_Y,O^X_Y\rangle$$

y se puede hacer exactamente lo mismo para $O^Z_Y$ .

Ya tenemos la respuesta. Siento que haya sido tan largo.

17voto

Did Puntos 1

Supongamos sin pérdida de generalidad que las variables aleatorias $A$ , $B$ , $C$ son estándar, es decir, con media cero y varianza unitaria. Entonces, para cualquier $(A,B,C)$ con las covarianzas prescritas, $$\mathrm{var}(A-B+C)=\mathrm{var}(A)+\mathrm{var}(B)+\mathrm{var}(C)-2\mathrm{cov}(A,B)-2\mathrm{cov}(B,C)+2\mathrm{cov}(A,C), $$ es decir, $$ \mathrm{var}(A-B+C)=3-2\cdot0.9-2\cdot0.8+2\cdot0.1=-0.2\lt0, $$ lo cual es absurdo.

Edita: Desde las correlaciones son cosenos para cada variable aleatoria tal que $\mathrm{corr}(A,B)=b$ , $\mathrm{corr}(A,C)=c$ y $\mathrm{corr}(B,C)=a$ hay que tener $$ a\geqslant bc-\sqrt{1-b^2}\sqrt{1-c^2}. $$ Para $b=0.9$ y $c=0.8$ se obtiene $a\geqslant.458$ .

7voto

uwe Puntos 1533

Como continuación a otra de las respuestas, me gustaría terminar la solución para que quede clara. Este enfoque me parece muy bonito (acento de Borat).

Para generar la matriz de correlaciones, puede dejar una de las correlaciones como $\rho$ Me voy. $\rho_{AC}$ aquí. \begin{bmatrix} 1 & 0.9 & \rho\\ 0.9 & 1 & 0.8\\ \rho & 0.8 & 1 \end{bmatrix}

Ahora, si calculas el determinante, obtendrás el límite para $\rho$ . El cálculo del determinante daría como resultado la siguiente ecuación (nótese que la matriz anterior es una matriz de correlación y tiene que ser al menos semidefinida):

$$ -0.45 + 0.72\rho + 0.72\rho - \rho^2 \ge 0 $$

haciéndolo más bonito, se verá así: $$ \rho^2 - 1.44\rho + 0.45 \le 0 $$

que es correcto si $ 0.458 \le \rho \le 0.981 $ . Esto significa que la correlación entre $A$ y $C$ debería estar en este rango, y no lo está.

6voto

Jorrit Reedijk Puntos 129

Puede utilizar el hecho de que las correlaciones pueden entenderse como cosenos entre vectores a partir del origen común. A continuación, aplicar la función arccos, y comprobar, si todas las sumas posibles pairwise son mayores que el tercer ángulo, de tal manera que hacen un tetraeder. Obtengo

[acos(0.9),acos(0.8),acos(0.1)]
 %1695 = [0.451026811796, 0.643501108793, 1.47062890563]

La suma de la primera y la segunda es menor que la tercera, por lo que esa combinación no puede proceder de una correlación trivariante.

0voto

Sizhe Wei Puntos 1

Para @egreif1 responder se puede entender fácilmente que $\rho(X, Y) = \rho(X - EX, Y)$ después de desplazar y escalar, la correlación entre dos variables es la misma. Así que para simplificar, podemos trabajar con media cero y varianza unitaria r.v.s. Puede ser otro pensamiento sobre el espacio de Hilbert.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X