2 votos

Denominador del estimador de la varianza

Estoy leyendo un artículo revisado por pares de un miembro muy respetado de mi campo. En él, el autor define ecuaciones para la media y la varianza de la media.

Screenshot from paper

Estoy tratando de entender por qué el denominador de la varianza tiene tanto n como n-1 en él. Pensaba que la ecuación básica de la varianza de una muestra aleatoria simple era simplemente

$\frac{1}{n}$ $\sum^{n}_{i=1} (x_{i} - \bar x ) ^ 2 $

y parece que este autor ha añadido un componente adicional al denominador, lo que cambia sustancialmente el valor de la varianza. ¿Puede alguien aclararme?

3voto

mark Puntos 232

El estimador que has escrito no es insesgado ¡! El estimador insesgado de la varianza de la población más utilizado es

$$ S^2 =\frac{1}{n-1} \sum_{i=1}^n \left(x_i - \bar{x} \right)^2$$

Su artículo se refiere entonces a la variación de la media de la muestra y proporciona un estimador para ello. Para dar sentido a ese estimador, recordemos que si denotamos por $\sigma^2$ la varianza poblacional de una sola observación, entonces la varianza (poblacional) de la media muestral es

$$Var\left(\frac{1}{n} \sum_{i=1}^n x_i \right) = \frac{\sigma^2}{n}$$

pero como la varianza de la población, $\sigma^2$ es desconocido, lo sustituimos por su estimador insesgado, es decir, el $S^2$ . Poniendo eso en el lugar de $\sigma^2$ se obtiene la ecuación (5).

Aquí hay una lectura útil - y emocionante - sobre el asunto.

Howard Wainer, Picturing the Uncertain World, La ecuación más peligrosa.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X