Sé que usamos $\frac1{n-1}\sum\limits_i(x_i - \bar{x})^2$ para estimar la varianza de una población. Recuerdo un vídeo de Khan Academy en el que la intuición que se daba era que nuestra media estimada está probablemente un poco alejada de la real por lo que las distancias $x_i - \bar{x}$ sería en realidad mayor, por lo que dividimos por menos ( $n-1$ en lugar de $n$ ) para obtener un valor mayor, lo que resulta en una mejor estimación.
Y recuerdo haber leído en alguna parte, que no necesito esta corrección si tengo la media real de la población $\mu$ en lugar de $\bar{x}$ . Así que yo estimaría $\frac1{n}\sum\limits_i(x_i - \mu)^2$
Pero ya no lo encuentro. ¿Es cierto? ¿Puede alguien indicarme algo?
Respuesta
¿Demasiados anuncios?Sí, es cierto. En el lenguaje de la estadística, diríamos que si no se conoce la media de la población, entonces la cantidad
$$\frac{1}{n-1} \sum_{i=1}^n \left(x_i-\bar{x} \right)^2$$
es insesgada, lo que significa simplemente que estima correctamente la varianza de la población de media . Pero si se conoce la media de la población, no es necesario utilizar una estimación de la misma: esto es lo que hace el $\bar{x}$ sirve para-y la corrección de la muestra finita que viene con ella.
De hecho, se puede demostrar que la cantidad
$$\frac{1}{n} \sum_{i=1}^n \left(x_i-\mu \right)^2$$
no sólo es insesgada, sino que también tiene una varianza menor que la cantidad anterior. Esto es bastante intuitivo, ya que ahora se ha eliminado parte de la incertidumbre. Así que utilizamos esta en esta situación.
Cabe destacar que los estimadores diferirán muy poco en tamaños de muestra grandes y, por tanto, son asintóticamente equivalente .