4 votos

Cálculo de desviación estándar no coinciden

Yo estaba buscando cómo desviaciones estándar de trabajo, y trató de hacerlo a mano, pero a lo que voy no es coincidente con lo que tengo en SQL Server.

Mi población es: 1,2,3,4,5,6,7,8,9. Termino con 2.58 utilizando el método descrito en la wikipedia. Sin embargo, SQL Server Y Microsoft Excel vienen con 2.73.

La parte final de mi ecuación se parece a esto: sqrt(60/9)

Así que, estoy a estropear algo? Si es así, ¿dónde?

6voto

Oli Puntos 89

Si usted mira de cerca en el artículo de la Wikipedia que ha citado usted, usted verá que calcula bien lo que ellos llaman la "desviación estándar de población" o lo que ellos llaman la "desviación estándar de la muestra," y no lo que ellos llaman la "desviación estándar de la muestra!" Para encontrar la desviación estándar de la muestra, tenemos que dividir $60$$8$, no $9$, y, a continuación, tomar la raíz cuadrada. Con sus números, que resulta ser de alrededor de $2.7386$.

El terminológica distinción que Wikipedia hace entre "la desviación estándar de la muestra" y "desviación estándar de la muestra" no es universal. Pero vamos a tratar primero con la desviación estándar de población. Si $X$ es una variable aleatoria con una media de $\mu$, entonces la varianza de $X$ es igual a $$E(X-\mu)^2.$$ En particular, si la variable aleatoria $X$ tiene una distribución uniforme en el conjunto $\{1,2,\dots,9\}$, entonces la varianza de $X$ es de hecho el $60/9$ que calcula.

Con las muestras, la situación es más complicada. Hay dos comúnmente utilizado estimadores de la varianza de la población. Si tenemos una muestra $X_1,X_2, \dots, X_n$ del tamaño de la $n$, luego de una norma estimador para la varianza de la población es $$\frac{1}{n}\sum_{i=1}^n (X_i-\overline{X})^2$$ y la otra es $$\frac{1}{n-1}\sum_{i=1}^n (X_i-\overline{X})^2,$$ en cada caso $\overline{X}$ es la media de la muestra$\frac{1}{n}\sum_{i=1}^n X_i$. Hay razones técnicas, en favor de cada uno. La segunda es imparcial estimador de la varianza de la población, cuando lo que existe, y es más comúnmente preferido. (La situación es más complicada que eso. Aunque el primer estimador de la media es el mal, es en promedio, en el medio de la plaza sentido, más cerca de la verdad! Y, en general, la raíz cuadrada de ninguna de nuestras expresiones es un estimador imparcial de la población desviación estándar.)

Al $n$ es grande, no hay mucha diferencia entre los dos estimadores, por lo que no necesitan prestar atención a qué versión está siendo utilizado. Pero para $n=9$, se tiene una diferencia significativa, y tenemos que ser conscientes de lo que la fórmula de una pieza de software que utiliza.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X