Si sabemos que $X_1, X_2, ..., X_n \sim \text{IID N}(\mu, \sigma^2)$ ¿Qué es $\mathbb{Cov}(X_1, \bar{X}_n)$ ? Dado que el conjunto de variables sigue una distribución IID, ¿la covarianza sería simplemente cero?
Respuesta
¿Demasiados anuncios?En este caso, la covarianza no será cero porque la media muestral incluye la variable $X_1$ como parte de ella; un valor más alto de esta última variable le dará una media muestral más alta y un valor más bajo le dará una media muestral más baja. En consecuencia, esperaríamos que estas dos cosas estuvieran correlacionadas positivamente.
Ahora, utilizando el hecho de que el operador de covarianza es lineal en cada uno de sus argumentos, se obtiene:
$$\begin{align} \mathbb{C}(X_1, \bar{X}_n) &= \mathbb{C} \Bigg( X_1, \frac{1}{n} \sum_{i=1}^n X_i \Bigg) \\[6pt] &= \frac{1}{n} \sum_{i=1}^n \mathbb{C} ( X_1, X_i ) \\[6pt] &= \frac{1}{n} \mathbb{C}(X_1, X_1) \\[6pt] &= \frac{1}{n} \mathbb{V}(X_1) \\[6pt] &= \frac{\sigma^2}{n}. \\[6pt] \end{align}$$
Esto confirma que la covarianza es positiva siempre que $\sigma>0$ . En $n \rightarrow \infty$ la media muestral depende cada vez menos del valor $X_1$ y la covarianza disminuye a cero. (Obsérvese también que este resultado no depende del supuesto de normalidad de las variables subyacentes; es válido para cualquier distribución subyacente con varianza finita).