17 votos

Determinar los elementos fuera de la diagonal de la matriz de covarianza, dados los elementos de la diagonal

Tengo alguna matriz de covarianza A=[121cc81]

El problema es determinar los posibles valores de c.

Ahora sé que los elementos de esta matriz se dan por la definición usual de la covarianza,

1N1Ni=1(Xiˉx)(Yiˉy)

y así por ejemplo,

1N1Ni=1(Xiˉx)2=121

1N1Ni=1(Yiˉy)2=81

Pero no veo cómo llegar a determinar c a partir de aquí?

27voto

jldugger Puntos 7490

Puede resultar instructivo comenzar con una idea básica: la varianza de cualquier variable aleatoria no puede ser negativa. (Esto es claro, ya que la varianza es la esperanza del cuadrado de algo y los cuadrados no pueden ser negativos.)

Cualquier matriz de covarianza 2×2 A presenta explícitamente las varianzas y covarianzas de un par de variables aleatorias (X,Y), pero también te indica cómo encontrar la varianza de cualquier combinación lineal de esas variables. Esto se debe a que siempre que a y b sean números,

Var(aX+bY)=a2Var(X)+b2Var(Y)+2abCov(X,Y)=(ab)A(ab).

Aplicando esto a tu problema podemos calcular

0Var(aX+bY)=(ab)(121cc81)(ab)=121a2+81b2+2c2ab=(11a)2+(9b)2+2c(11)(9)(11a)(9b)=α2+β2+2c(11)(9)αβ.

Los últimos pasos en los que se introdujeron α=11a y β=9b no eran necesarios, pero ayudan a simplificar el álgebra. En particular, lo que necesitamos hacer a continuación (para encontrar límites para c) es completar el cuadrado: este es el proceso que emula la derivación de la fórmula cuadrática a la que todos somos introducidos en la escuela primaria. Escribiendo

C=c(11)(9),

encontramos

α2+β2+2c2(11)(9)αβ=α2+2Cαβ+β2=(α+Cβ)2+(1C2)β2.

Porque (α+Cβ)2 y β2 son ambos cuadrados, no son negativos. Por lo tanto, si 1C2 también es no negativo, todo el lado derecho no es negativo y puede ser una varianza válida. En cambio, si 1C2 es negativo, podrías establecer α=cβ para obtener el valor (1C2)β2<0 en el lado derecho, lo cual es inválido.

Por lo tanto, deduces (a partir de estas consideraciones algebraicas perfectamente elementales) que

Si A es una matriz de covarianza válida, entonces 1C2 no puede ser negativo.

De manera equivalente, |C|1, lo cual significa, según (), que (11)(9)c(11)(9).


Queda la pregunta de si algún c así corresponde a una matriz de varianza real. Una forma de demostrar que esto es cierto es encontrar una variable aleatoria (X,Y) con A como su matriz de covarianza. Aquí hay una forma (de muchas).

Doy por sentado que puedes construir variables aleatorias independientes A y B con varianzas unitarias: es decir, Var(A)=Var(B)=1. (Por ejemplo, permite que (A,B) tome los cuatro valores (±1,±1) con probabilidades iguales de 1/4 cada una.)

La independencia implica Cov(A,B)=0. Dado un número c en el rango de (11)(9) a (11)(9), define variables aleatorias

X=112c2/92A+(c/9)B,Y=9B

(lo cual es posible porque 112c2/920) y calcula que la matriz de covarianza de (X,Y) es precisamente A.


Finalmente, si llevas a cabo el mismo análisis para cualquier matriz simétrica A=(abbd), concluirás tres cosas:

  1. a0.

  2. d0.

  3. adb20.

Estas condiciones caracterizan matrices simétricas, semi-definidas positivas. Cualquier matriz 2×2 que satisfaga estas condiciones realmente es una matriz de varianza. (Emula la construcción anterior.)

17voto

AYA Puntos 104

Un método intuitivo para determinar rápidamente esta respuesta es simplemente recordar que las matrices de covarianza pueden interpretarse en la forma

A=(σ21ρ12σ1σ2ρ13σ1σ3ρ1nσ1σnσ22ρ23σ2σ3ρ2nσ2σnσ23ρ3nσ3σnσ2n)

donde ρab[1,1] es un Coeficiente de Correlación de Pearson. En tu caso tienes

σ21=121,   σ22=81  |c|12181=99

es decir, c[99,99].

13voto

Hunaphu Puntos 622

A es posdefinita, por lo que según el criterio de Sylvester det(A)=12181c20. Por lo tanto, cualquier c[99,99] producirá una matriz de covarianza válida.

5voto

jgradim Puntos 1143

Hay tres posibilidades principales a tener en cuenta. Una es que las variables estén sin correlación, en cuyo caso las entradas fuera de la diagonal son fáciles de calcular como 0. Otra posibilidad es que realmente no tengas dos variables diferentes. y es simplemente un múltiplo escalar de x (es decir, una correlación perfecta). Si y=cx, entonces σxy=σxσxy=99. Obtenemos una tercera posibilidad al notar que lo anterior asume c>0. Para c<0, obtenemos σxy=99.

Geométricamente, la covarianza entre dos vectores es el producto de sus longitudes multiplicado por el coseno del ángulo entre ellos. Dado que el coseno varía de 1 a 1, la covarianza varía desde el producto de sus longitudes hasta el negativo del producto.

Otro enfoque es considerar z1=xμxσx y z2=yμyσy. σxy=σ(σxz1)(σyz2)=σxσyσz1z2=99σz1z2 y σz1z2 es simplemente la correlación entre x y y, que varía de 1 a 1.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X