Processing math: 100%

4 votos

¿Por qué la suma de las diferencias al cuadrado de la media de la muestra es más pequeña que la suma de las diferencias al cuadrado de la media real?

Por lo que la descripción que he leído es:

Es importante tener en cuenta que las fórmulas para el cálculo de la varianza y la desviación estándar difieren dependiendo de si usted está trabajando con una distribución de puntuaciones tomadas a partir de una muestra o de una de la población. La razón de estas dos fórmulas son diferentes es bastante complejo y requiere más espacio que permite en un corto libro como este. Me ofrecen un aspecto demasiado breve explicación aquí y, a continuación, anime usted para encontrar una explicación más detallada en un tradicional estadísticas los libros de texto. Brevemente, cuando no sabemos que la media de población, debemos el uso de la media de la muestra como una estimación. Pero la media de la muestra probablemente difieren de la media de población. Cada vez que usamos un número distinto de el real media para calcular la varianza, vamos a terminar con un mayor varianza, y por lo tanto una desviación estándar mayor, que si nos había utilizado la real media. Esto será cierto independientemente de si el número utilizamos en nuestra fórmula es más pequeño o más grande que el actual decir. Debido a que la media de la muestra difiere de la población la media, la varianza y la desviación estándar que podemos calcular mediante la la media de la muestra probablemente será menor de lo que hubiera se utiliza la media de población. Por lo tanto, cuando utilizamos la media de la muestra para generar una estimación de la población de la varianza o la desviación estándar, que en realidad se subestimar el tamaño de la verdadera varianza de la de la población debido a que si se hubiera utilizado la media de población en lugar de la la media de la muestra, se habría creado una mayor suma de cuadrados de las desviaciones, y una mayor desviación estándar y la varianza. Para ajustar este subestimación, hacemos uso de n - 1 en el denominador de nuestra muestra las fórmulas. Pequeños denominadores producir mayor varianza global y estadísticas de desviación estándar, la cual será estimaciones más precisas de los parámetros de la población.

Entendí nada de esto, lo que parece contradictorio. Se dice que cuando se utiliza un número de otros que la media (a mí, por ejemplo, la media de la muestra) va a ser diferente a la población causando una mayor varianza. En el medio se dice que la varianza y la media de la muestra será menor si la población había sido utilizado... ¿Puede por favor explicar que es exactamente y por qué así?

9voto

Niall Puntos 51

Esto parece igual de descuidado elección de las palabras. La frase

Siempre que utilice un número de otros que la media para calcular la varianza, vamos a terminar con una mayor varianza

parece que significa el término 'real significa" para referirse a la media de la muestra. Creo que aquí es donde tu confusión viene de. Esto se evidencia aún más a partir de la sentencia

la varianza y la desviación estándar que nos calcular usando la media de la muestra probablemente será menor de lo que hubiera utilizado la media de población.

Él al parecer utiliza esta intuitiva de motivación para que nos muestre por qué la varianza de la muestra está sesgada hacia abajo, cuando dice:

Por lo tanto, cuando utilizamos la media de la muestra para generar una estimación de la población de la varianza o la desviación estándar, que en realidad se subestimar el tamaño de la verdadera varianza

Para ver por qué esto es cierto, definir una función

f(c)=1nni=1(xic)2

El uso básico del cálculo, de la minimizer de f satisface f(c)=0, que es equivalente a

ni=1(xic)=0

por lo tanto, el minimizer es

c=1nni=1xi,

la media aritmética de las xi's. Yo voy a dejar a usted para comprobar que esto es un mínimo y no un máximo.

En el caso de los datos, X1,...,Xn con la media de la muestra ¯X, f(¯X) es exactamente la varianza de la muestra. Dado lo que hemos dicho más arriba

f(¯X)f(z)

para cualquier otro z, que incluye el caso en que z=μ, la media de población. Esta es la razón por la varianza de la muestra es siempre menor que la media del cuadrado de la diferencia de la media de población (excepto en el caso de que ¯X=μ, lo cual ocurre con probabilidad cero cuando la Xi's provienen de una distribución continua).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X