11 votos

La intuición detrás de la fórmula para la varianza de una suma de dos variables

Sé que a partir de estudios anteriores que

$Var(A+B) = Var(A) + Var(B) + 2 Cov (A,B)$

Sin embargo, no entiendo por qué. Puedo ver que el efecto 'push up' de la varianza cuando a y B covarían altamente. Es lógico que cuando se crea un compuesto a partir de dos muy correlacionadas con las variables que tiende a ser la adición de la alta observaciones de Una con la alta observaciones de B, y la baja de las observaciones de Una con la baja observaciones de B. Esto se tienden tienden a crear extrema alta y baja de los valores en la composición variable, el aumento de la variación de la composición.

Pero ¿por qué se hace para multiplicar la covarianza por exactamente 2?

24voto

john samuels135 Puntos 111

Respuesta Simple:

La variación consiste en un cuadrado: $$Var(X) = E[(X - E[X])^2]$$

Así, su pregunta se reduce a un factor de 2 en la plaza de identidad:

$$(a+b)^2 = a^2 + b^2 + 2ab$$

Lo cual puede ser entendido visualmente como una descomposición del área de un cuadrado de lado a $(a+b)$ en el área de los cuadrados más pequeños de los lados $a$$b$, además de los dos rectángulos de lados $a$$b$:

enter image description here

Más involucrados respuesta:

Si quieres un matemáticamente más involucrados respuesta, la covarianza es una forma bilineal, es decir, es lineal, tanto en su primero y segundo de los argumentos, esto conduce a:

$$\begin{aligned} Var(A+B) &= Cov(A+B, A+B) \\ &= Cov(A, A+B) + Cov(B, A+B) \\ &= Cov(A,A) + Cov(A,B) + Cov(B,A) + Cov(B,B) \\ &= Var(A) + 2 Cov(A,B) + Var(B) \end{aligned}$$

En la última línea, he utilizado el hecho de que la covarianza es simétrica: $$Cov(A,B) = Cov(B,A)$$

Para resumir:

Es dos, ya que tiene en cuenta tanto $cov(A,B)$$cov(B,A)$.

5voto

jgradim Puntos 1143

El conjunto de variables aleatorias es un espacio vectorial, y muchas de las propiedades del espacio Euclidiano puede compararse a ellos. La desviación estándar actúa como una longitud, y la varianza como la longitud al cuadrado. La independencia corresponde a ser ortogonal, mientras que la correlación perfecta corresponde con la multiplicación escalar. Por lo tanto, la varianza de las variables independientes siga el Teorema de Pitágoras:
$var(A+B) = var(A)+var(B)$.

Si no están perfectamente correlacionados, entonces
$std(A+B) = std(A)+std(B)$

Tenga en cuenta que esto es equivalente a
$var(A+B) = var(A)+var(B)+2\sqrt{var(A)var(B)}$

Si ellos no son independientes, entonces que siga una ley análoga a la ley de los cosenos:
$var(A+B) = var(A)+var(B)+2cov(A,B)$

Tenga en cuenta que el caso general, es uno de entre una completa independencia y correlación perfecta. Si $A$ $B$ son independientes, entonces la $cov(A,B)$ es cero. Para el caso general es que el $var(A,B)$ siempre tiene un $var(A)$ plazo y un $var(B)$ plazo, y, luego, la variación en el $2\sqrt{var(A)var(B)}$ plazo; la más correlacionadas las variables, la más grande de este tercer término será. Y esto es precisamente lo $2cov(A,B)$: $2\sqrt{var(A)var(B)}$ veces $r^2$$A$$B$.

$var(A+B) = var(A)+var(B)+MeasureOfCorrelation*PerfectCorrelationTerm$

donde $MeasureOfCorrelation = r^2$ $PerfectCorrelationTerm=2\sqrt{var(A)var(B)}$

Puesto en otros términos, si $r = correl(A,B)$, luego

$\sigma_{A+B} = \sigma_A^2+\sigma_B^2+ 2(r\sigma_A)(r\sigma_B)$

Por lo tanto, $r^2$ es análoga a la $cos$ en la Ley de los Cosenos.

2voto

Ped Puntos 6

Me gustaría añadir que lo que has citado no es la definición de $Var(A+B)$, sino más bien una consecuencia de las definiciones de $Var$$Cov$. Así que la respuesta a por qué la ecuación tiene es el cálculo realizado por byouness. Tu pregunta puede realmente ser por eso que tiene sentido; de manera informal:

Cuánto $A+B$ "variar" depende de cuatro factores:

  1. Cuánto $A$ variaría en su propio.
  2. Cuánto $B$ variaría en su propio.
  3. Cuánto $A$ variarán $B$ se mueve en torno a (o variable).
  4. Cuánto $B$ variarán $A$ se mueve alrededor.

Lo que nos lleva a $$Var(A+B)=Var(A)+Var(B)+Cov(A,B)+Cov(B,A)$$ $$=Var(A)+Var(B)+2Cov(A,B)$$ debido a $Cov$ es un operador simétrico.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X