Sé que usamos 1n−1∑i(xi−ˉx)21n−1∑i(xi−¯x)2 para estimar la varianza de una población. Recuerdo un vídeo de Khan Academy en el que la intuición que se daba era que nuestra media estimada está probablemente un poco alejada de la real por lo que las distancias xi−ˉxxi−¯x sería en realidad mayor, por lo que dividimos por menos ( n−1n−1 en lugar de nn ) para obtener un valor mayor, lo que resulta en una mejor estimación.
Y recuerdo haber leído en alguna parte, que no necesito esta corrección si tengo la media real de la población μμ en lugar de ˉx¯x . Así que yo estimaría 1n∑i(xi−μ)21n∑i(xi−μ)2
Pero ya no lo encuentro. ¿Es cierto? ¿Puede alguien indicarme algo?
Respuesta
¿Demasiados anuncios?Sí, es cierto. En el lenguaje de la estadística, diríamos que si no se conoce la media de la población, entonces la cantidad
1n−1n∑i=1(xi−ˉx)21n−1n∑i=1(xi−¯x)2
es insesgada, lo que significa simplemente que estima correctamente la varianza de la población de media . Pero si se conoce la media de la población, no es necesario utilizar una estimación de la misma: esto es lo que hace el ˉx¯x sirve para-y la corrección de la muestra finita que viene con ella.
De hecho, se puede demostrar que la cantidad
1nn∑i=1(xi−μ)21nn∑i=1(xi−μ)2
no sólo es insesgada, sino que también tiene una varianza menor que la cantidad anterior. Esto es bastante intuitivo, ya que ahora se ha eliminado parte de la incertidumbre. Así que utilizamos esta en esta situación.
Cabe destacar que los estimadores diferirán muy poco en tamaños de muestra grandes y, por tanto, son asintóticamente equivalente .