4 votos

Una pregunta trivial sobre covarianza

Estoy aprendiendo acerca de la Covarianza y se encontraron con algo que no acabo de entender.

Supongamos que tenemos dos variables aleatorias X y Y, donde los respectivos conjuntos-función de probabilidad asigna el mismo peso a cada evento.

De acuerdo a wikipedia, la Cov(X, Y) se pueden caluculated de la siguiente manera:

$${\displaystyle \operatorname {cov} (X,Y)={\frac {1}{n}}\sum _{i=1}^{n}(x_{i}-E(X))(y_{i}-E(Y)).}$$

Lo que me confunde es el hecho, que se suma sólo sobre $x_i$ y $y_i$; $i=1,...,n$ , pero no $x_i$ y $y_j; \;i=1,...,n$ $j=1,...,m$ , por lo tanto muchas combinaciones posibles no se calculan. En otras palabras, si nos fijamos en cada una calculada combinación de forma individual, sólo obtendremos una $n*1$ matriz, en lugar de una $n*m$ matriz.

¿Alguien puede explicar esto (supongo que es bastante obvio, pero yo no veo la razón de que en el momento).

Lo siento por la dumbish pregunta y gracias de antemano.

5voto

Martin Robins Puntos 1893

La idea es que los posibles resultados de la muestra se $i=1, \ldots, n$, y cada uno de los resultados $i$ tiene la misma probabilidad $\frac{1}{n}$ (bajo la medida de probabilidad que asigna la misma probabilidad a todos los resultados que aparecen a utilizar). Ha $n$ de los resultados, no $n^2$.

Algo disfrute de su idea, se podría calcular:

$$ \operatorname{Cov}(X,Y) = \sum_i \sum_j (x_i - \mu_x) (y_j - \mu_y) P(X = x_i, Y = y_j )$$

Donde:

  • $P(X = x_i, Y = y_j) = \frac{1}{n}$ si $i=j$, ya que el resultado se produce $1/n$ veces.
  • $P(X = x_i, Y = y_j) = 0 $ si $i \neq j$, ya que el resultado no o no ocurrir.

Pero entonces sólo tendría:

$$ \sum_i \sum_j (x_i - \mu_x) (y_j - \mu_y) P(X = x_i, Y = y_j ) = \sum_i (x_i - \mu_x) (y_i - \mu_y) P(X = x_i, Y = y_i ) $$

Que es lo que la fórmula original es al $P(X = x_i, Y = y_i ) = \frac{1}{n}$.

Intuitivamente parece que quieren algo como $P(X = x_i, Y = y_j ) = \frac{1}{n^2}$, pero que está muy mal.

Simple dados ejemplo (para construir la intuición):

Deje $X$ ser el resultado de un rollo de una sola de 6 lados morir. Deje $Y = X^2$.

Recordemos que un espacio de probabilidad tiene tres componentes: un espacio muestral $\Omega$, un conjunto de eventos $\mathcal{F}$, y una probabilidad de medida $P$ que asigna probabilidades a los eventos. (Me voy a la mano de la onda de lejos el evento de cosas para mantenerlo simple.)

$X$ $Y$ son funciones de$\Omega$$\mathcal{R}$. Podemos escribir los valores posibles para $X$ $Y$ como una función de la $\omega \in \Omega$

$$ \begin{array}{rrr} & X(\omega) & Y(\omega) \\ \omega_1 & 1 & 1\\ \omega_2 & 2 & 4 \\ \omega_3 & 3 & 9 \\ \omega_4 & 4 & 16 \\ \omega_5 & 5 & 25 \\ \omega_6 & 6 & 36 \end{array} $$

No tenemos 36 resultados posibles aquí. Tenemos 6.

Desde cada uno de los resultados de un dado tiene la misma probabilidad, tenemos $P( \{ \omega_1) \}) = P( \{ \omega_2) \}) = P( \{ \omega_3) \}) = P( \{ \omega_4) \}) = P( \{ \omega_5)\}) = P( \{ \omega_6) \}) = \frac{1}{6}$. (Si el morir no era justo, estos números podrían ser diferentes.)

¿Cuál es la media de $X$?

\begin{align*} \operatorname{E}[X] = \sum_{\omega \in \Omega} X(\omega) P( \{ \omega \} ) &= 1 \frac{1}{6} + 2\frac{1}{6} + 3 \frac{1}{6} + 4 \frac{1}{6} + 5 \frac{1}{6} + 6 \frac{1}{6}\\ &= \frac{7}{2} \end{align*}

¿Cuál es la media de $Y$?

\begin{align*} \operatorname{E}[Y] = \sum_{\omega \in \Omega} X(\omega) P( \{ \omega \} ) &= 1 \frac{1}{6} + 4\frac{1}{6} + 9 \frac{1}{6} + 16 \frac{1}{6} + 25 \frac{1}{6} + 36 \frac{1}{6}\\ &= \frac{91}{6} \end{align*}

¿Cuál es la covarianza de $X$$Y$?

\begin{align*} \sum_{\omega \in \Omega} \left(X(\omega) - \frac{7}{2}\right)\left( Y(\omega) - \frac{91}{6}\right) P( \{ \omega \} ) &= \left( 1 - \frac{7}{2} \right)\left( 1 - \frac{91}{6} \right) P(\{\omega_1\}) + \left( 2 - \frac{7}{2} \right)\left( 4 - \frac{91}{6} \right) P(\{\omega_2\}) + \left( 3 - \frac{7}{2} \right)\left( 9 - \frac{91}{6} \right) P(\{\omega_3\}) + \left( 4 - \frac{7}{2} \right)\left( 16 - \frac{91}{6} \right) P(\{\omega_4\}) + \left( 5 - \frac{7}{2} \right)\left( 25 - \frac{91}{6} \right) P(\{\omega_5\}) + \left( 6 - \frac{7}{2} \right)\left( 36 - \frac{91}{6} \right) P(\{\omega_6\}) \\ &\approx 20.4167 \end{align*}

No se preocupe acerca de la aritmética. El punto es que para calcular el $\operatorname{Cov}\left(X , Y\right) = \operatorname{E}\left[(X -\operatorname{E}[X])(Y - \operatorname{E}[Y]) \right] = \sum_{\omega \in \Omega} \left(X(\omega) - \operatorname{E}[X]\right)\left( Y(\omega) - \operatorname{E}[Y]\right) P( \{ \omega \} ) $ que suma más de los 6 posibles resultados $\omega_1, \ldots, \omega_6$.

De regreso a su situación...

Los posibles resultados de la muestra se $i=1\, \ldots, n$. Esos son los resultados que deben sumar más.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X