2 votos

Impacto del tamaño de la muestra en la covarianza de la muestra

A partir de la fórmula de la covarianza muestral, vemos

$$\operatorname{Cov}(X,Y) = \frac{1}{m} \sum_{i=1}^m (x_i - \bar{x})(y_i - \bar{y})$$

donde $\bar{x}, \bar{y}$ son las medias muestrales. Parece que el tamaño de la muestra $m$ influirá en el resultado final. ¿Es cierta la intuición?

2voto

Aaron Puntos 36

Recuerde que si aumenta el número de puntos de datos, entonces necesitará nuevos puntos de datos reales para que tengas más $x_i$ y $y_i$ valores. Esto significa que el valor $m$ en tu fórmula cambiará, pero ahora también tendrás términos adicionales en tu suma, así que eso también cambiará. Así que sí, la covarianza de la muestra cambiará a medida que obtenga más valores (excepto en casos muy inusuales) porque está utilizando un conjunto de datos diferente .

Suponiendo que las secuencias $(X_1,Y_1), (X_2,Y_2), (X_3,Y_3), ...$ son intercambiables, ya que $m \rightarrow \infty$ la covarianza de la muestra convergerá a la verdadera covarianza entre los pares de valores. Por lo tanto, en este caso, por lo general se espera que a medida que $m$ la covarianza de la muestra empezará a ser más estable (es decir, cambiará menos) y convergerá hacia un valor fijo.


Nota adicional: Es habitual que la covarianza muestral se defina con la incorporación de Corrección de Bessel (es decir, utilizando $m-1$ en el denominador en lugar de $m$ ). Esto se hace para garantizar que la covarianza de la muestra es un estimador insesgado de la covarianza real.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X