La idea es que los posibles resultados de la muestra se $i=1, \ldots, n$, y cada uno de los resultados $i$ tiene la misma probabilidad $\frac{1}{n}$ (bajo la medida de probabilidad que asigna la misma probabilidad a todos los resultados que aparecen a utilizar). Ha $n$ de los resultados, no $n^2$.
Algo disfrute de su idea, se podría calcular:
$$ \operatorname{Cov}(X,Y) = \sum_i \sum_j (x_i - \mu_x) (y_j - \mu_y) P(X = x_i, Y = y_j )$$
Donde:
- $P(X = x_i, Y = y_j) = \frac{1}{n}$ si $i=j$, ya que el resultado se produce $1/n$ veces.
- $P(X = x_i, Y = y_j) = 0 $ si $i \neq j$, ya que el resultado no o no
ocurrir.
Pero entonces sólo tendría:
$$ \sum_i \sum_j (x_i - \mu_x) (y_j - \mu_y) P(X = x_i, Y = y_j ) = \sum_i (x_i - \mu_x) (y_i - \mu_y) P(X = x_i, Y = y_i ) $$
Que es lo que la fórmula original es al $P(X = x_i, Y = y_i ) = \frac{1}{n}$.
Intuitivamente parece que quieren algo como $P(X = x_i, Y = y_j ) = \frac{1}{n^2}$, pero que está muy mal.
Simple dados ejemplo (para construir la intuición):
Deje $X$ ser el resultado de un rollo de una sola de 6 lados morir. Deje $Y = X^2$.
Recordemos que un espacio de probabilidad tiene tres componentes: un espacio muestral $\Omega$, un conjunto de eventos $\mathcal{F}$, y una probabilidad de medida $P$ que asigna probabilidades a los eventos. (Me voy a la mano de la onda de lejos el evento de cosas para mantenerlo simple.)
$X$ $Y$ son funciones de$\Omega$$\mathcal{R}$. Podemos escribir los valores posibles para $X$ $Y$ como una función de la $\omega \in \Omega$
$$ \begin{array}{rrr} & X(\omega) & Y(\omega) \\
\omega_1 & 1 & 1\\
\omega_2 & 2 & 4 \\
\omega_3 & 3 & 9 \\
\omega_4 & 4 & 16 \\
\omega_5 & 5 & 25 \\
\omega_6 & 6 & 36
\end{array}
$$
No tenemos 36 resultados posibles aquí. Tenemos 6.
Desde cada uno de los resultados de un dado tiene la misma probabilidad, tenemos $P( \{ \omega_1) \}) = P( \{ \omega_2) \}) = P( \{ \omega_3) \}) = P( \{ \omega_4) \}) = P( \{ \omega_5)\}) = P( \{ \omega_6) \}) = \frac{1}{6}$. (Si el morir no era justo, estos números podrían ser diferentes.)
¿Cuál es la media de $X$?
\begin{align*}
\operatorname{E}[X] = \sum_{\omega \in \Omega} X(\omega) P( \{ \omega \} ) &= 1 \frac{1}{6} + 2\frac{1}{6} + 3 \frac{1}{6} + 4 \frac{1}{6} + 5 \frac{1}{6} + 6 \frac{1}{6}\\
&= \frac{7}{2}
\end{align*}
¿Cuál es la media de $Y$?
\begin{align*}
\operatorname{E}[Y] = \sum_{\omega \in \Omega} X(\omega) P( \{ \omega \} ) &= 1 \frac{1}{6} + 4\frac{1}{6} + 9 \frac{1}{6} + 16 \frac{1}{6} + 25 \frac{1}{6} + 36 \frac{1}{6}\\
&= \frac{91}{6}
\end{align*}
¿Cuál es la covarianza de $X$$Y$?
\begin{align*}
\sum_{\omega \in \Omega} \left(X(\omega) - \frac{7}{2}\right)\left( Y(\omega) - \frac{91}{6}\right) P( \{ \omega \} ) &= \left( 1 - \frac{7}{2} \right)\left( 1 - \frac{91}{6} \right) P(\{\omega_1\}) + \left( 2 - \frac{7}{2} \right)\left( 4 - \frac{91}{6} \right) P(\{\omega_2\}) + \left( 3 - \frac{7}{2} \right)\left( 9 - \frac{91}{6} \right) P(\{\omega_3\}) + \left( 4 - \frac{7}{2} \right)\left( 16 - \frac{91}{6} \right) P(\{\omega_4\}) + \left( 5 - \frac{7}{2} \right)\left( 25 - \frac{91}{6} \right) P(\{\omega_5\}) + \left( 6 - \frac{7}{2} \right)\left( 36 - \frac{91}{6} \right) P(\{\omega_6\}) \\
&\approx 20.4167
\end{align*}
No se preocupe acerca de la aritmética. El punto es que para calcular el $\operatorname{Cov}\left(X , Y\right) = \operatorname{E}\left[(X -\operatorname{E}[X])(Y - \operatorname{E}[Y]) \right] = \sum_{\omega \in \Omega} \left(X(\omega) - \operatorname{E}[X]\right)\left( Y(\omega) - \operatorname{E}[Y]\right) P( \{ \omega \} ) $ que suma más de los 6 posibles resultados $\omega_1, \ldots, \omega_6$.
De regreso a su situación...
Los posibles resultados de la muestra se $i=1\, \ldots, n$. Esos son los resultados que deben sumar más.