45 votos

Determinación de la varianza a partir de la suma de dos variables correlacionadas al azar

Entiendo que la varianza de la suma de dos variables aleatorias independientes distribuidas normalmente es la suma de las varianzas, pero ¿cómo cambia esto cuando las dos variables aleatorias están correlacionadas?

2 votos

Hay que añadir el doble de covarianza.

0 votos

También hay una buena (y sencilla) explicación en Cosas de la visión .

56voto

Joe Lencioni Puntos 4642

Para dos variables aleatorias cualesquiera: $$\text{Var}(X+Y) =\text{Var}(X)+\text{Var}(Y)+2\text{Cov}(X,Y).$$ Si las variables no están correlacionadas (es decir, $\text{Cov}(X,Y)=0$ ), entonces

$$\tag{1}\text{Var}(X+Y) =\text{Var}(X)+\text{Var}(Y).$$ En particular, si $X$ y $Y$ son independientes, entonces la ecuación $(1)$ se mantiene.

En general $$ \text{Var}\Bigl(\,\sum_{i=1}^n X_i\,\Bigr)= \sum_{i=1}^n\text{Var}( X_i)+ 2\sum_{i< j} \text{Cov}(X_i,X_j). $$ Si para cada $i\ne j$ , $X_i$ y $X_j$ no están correlacionados, en particular si el $X_i$ son independientes entre sí (es decir, $X_i$ y $X_j$ son independientes siempre que $i\ne j$ ), entonces $$ \text{Var}\Bigl(\,\sum_{i=1}^n X_i\,\Bigr)= \sum_{i=1}^n\text{Var}( X_i) . $$

1 votos

No estoy familiarizado con la suma(i<j). ¿Puedes explicar qué significa esta notación?

4 votos

@soo Se calculan todas las covarianzas $\text{Cov}(X_i,X_j)$ con $i<j$ y resumirlos. Otra forma de escribir $2\sum_{i<j}$ en este caso es escribir $\sum_{i\ne j}$ . (El 2 está ahí en la primera suma porque en la segunda suma se calcula, por ejemplo $\text{Cov}(X_1,X_2)$ y $\text{Cov}(X_2,X_1)$ pero estos son iguales.

0 votos

David, excelente explicación, el 2 en el 2*cov(...) tiene más sentido ahora. Además, ¿puedes explicar por qué no definirías un límite superior "n" en la suma(i<j)? Sólo por mi curiosidad personal. Gracias

8voto

qkhhly Puntos 31

También puedes pensar en forma de vector:

$Var(a^T X) = a^T Var(X) a$

donde $a$ puede ser un vector o una matriz, $X = (x_1, x_2, \dots, x_3)^T$ es un vector de variables aleatorias. $Var(X)$ es la matriz de covarianza.

Si $a = (1, 1, \dots, 1)^T$ entonces $a^T X$ es la suma de todos los $x's$

8voto

rinspy Puntos 128

Vamos a resolverlo a partir de las definiciones. Digamos que tenemos 2 variables aleatorias $x$ y $y$ con medios $\mu_x$ y $\mu_y$ . Entonces las varianzas de $x$ y $y$ sería:

$${\sigma_x}^2 = \frac{\sum_i(\mu_x-x_i)(\mu_x-x_i)}{N}$$ $${\sigma_y}^2 = \frac{\sum_i(\mu_y-y_i)(\mu_y-y_i)}{N}$$

Covarianza de $x$ y $y$ es:

$${\sigma_{xy}} = \frac{\sum_i(\mu_x-x_i)(\mu_y-y_i)}{N}$$

Ahora, consideremos la suma ponderada $p$ de $x$ y $y$ :

$$\mu_p = w_x\mu_x + w_y\mu_y$$

$${\sigma_p}^2 = \frac{\sum_i(\mu_p-p_i)^2}{N} = \frac{\sum_i(w_x\mu_x + w_y\mu_y - w_xx_i - w_yy_i)^2}{N} = \frac{\sum_i(w_x(\mu_x - x_i) + w_y(\mu_y - y_i))^2}{N} = \frac{\sum_i(w^2_x(\mu_x - x_i)^2 + w^2_y(\mu_y - y_i)^2 + 2w_xw_y(\mu_x - x_i)(\mu_y - y_i))}{N} \\ = w^2_x\frac{\sum_i(\mu_x-x_i)^2}{N} + w^2_y\frac{\sum_i(\mu_y-y_i)^2}{N} + 2w_xw_y\frac{\sum_i(\mu_x-x_i)(\mu_y-y_i)}{N} \\ = w^2_x\sigma^2_x + w^2_y\sigma^2_y + 2w_xw_y\sigma_{xy}$$

5voto

benvie Puntos 6181

Consideremos una función de dos variables, $ z = f(x, y) $ . Entonces la variación de z, $\delta z$ es $$\tag{1} \delta z = \frac{df}{dx} \ \delta x $$ donde $$ \frac{df}{dx} = \frac{\partial f}{\partial x} + \frac{\partial f}{\partial y} \frac{ dy}{dx}. $$ Elevando al cuadrado la ecuación (1) obtenemos $$ (\delta z)^2 = \Big[ \left( \frac{\partial f}{\partial x} \right)^2 + 2 \frac{\partial f}{\partial x} \frac{\partial f}{\partial y} \frac{dy}{dx} + \left( \frac{\partial f}{\partial y}\right)^2 \left( \frac{dy}{dx} \right)^2 \Big] (\delta x)^2. $$ Multiplicando esto obtenemos $$ (\delta z)^2 = \left( \frac{\partial f}{\partial x} \right)^2 (\delta x)^2+ 2 \frac{\partial f}{\partial x} \frac{\partial f}{\partial y} \delta x \delta y + \left( \frac{\partial f}{\partial y}\right)^2 (\delta y)^2, $$ donde hemos utilizado que $\delta y = \frac{dy}{dx} \delta x$ . Ahora podemos identificar los términos de variación cuadrática con las varianzas y covarianzas de las variables aleatorias: $$ \text{Var}(z) = \left( \frac{\partial f}{\partial x} \right)^2 \text{Var}(x) + 2 \frac{\partial f}{\partial x} \frac{\partial f}{\partial y} \text{Cov}(x,y) + \left( \frac{\partial f}{\partial y}\right)^2 \text{Var}(y). $$ Cuando la función $f$ es sólo una suma de $x$ y $y$ entonces los términos de la derivada parcial son todos iguales a uno, dando $$\text{Var}(z) = \text{Var}(x) + 2\ \text{Cov}(x,y) + \text{Var}(y). $$

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X