En el libro de texto "New Comprehensive Mathematics for O Level" de Greer (1983), veo que la desviación promedio se calcula de la siguiente manera:
Suma las diferencias absolutas entre los valores individuales y la media. Luego obtén su promedio. A lo largo del capítulo se utiliza el término desviación media.
Pero recientemente he visto varias referencias que utilizan el término desviación estándar y esto es lo que hacen:
Calculan los cuadrados de las diferencias entre los valores individuales y la media. Luego obtienen su promedio y finalmente la raíz de la respuesta.
Probé ambos métodos en un conjunto común de datos y sus respuestas difieren. No soy estadístico. Me confundí al intentar enseñar desviación a mis hijos.
Entonces, en resumen, ¿los términos desviación estándar y desviación media son lo mismo o es incorrecto mi antiguo libro de texto?
4 votos
Las dos cantidades difieren. Ponderan los datos de manera diferente. La desviación estándar será mayor y está relativamente más afectada por los valores más grandes. La desviación estándar (especialmente la versión con denominador n) se puede entender como una desviación cuadrática media. Las desviaciones estándar son más comúnmente utilizadas.
10 votos
Muy relacionado: ….
0 votos
Gary Kader tiene una forma divertida de enseñar a los niños a derivar la desviación media absoluta.
4 votos
Por cierto, una razón por la que la gente tiende a preferir la desviación estándar es porque las varianzas de sumas de variables aleatorias no relacionadas se suman (y las relacionadas tienen también una fórmula simple). Eso no sucede con la desviación media.
1 votos
Un punto importante es que la desviación estándar deriva de un modelo de errores al cuadrado (norma L2, piensa en la distribución normal) mientras que la media de las diferencias absolutas corresponde a la norma L1 (piensa en la distribución exponencial simétrica): por lo tanto, es más adecuada (o sea, sensible) a valores atípicos y distribuciones dispersas
0 votos
Aquí hay un artículo sobre el debate: media vs. desviación estándar
0 votos
@Glen_b Escribiste "las desviaciones de las sumas de variables aleatorias no relacionadas se suman" y estoy seguro de que me falta alguna información útil para tu punto, porque también estoy seguro de que puedo sumar cualquier cantidad finita de cantidades numéricas finitas (ya sean DE, MADs u otras). ¿Puedes ampliar?. (Además: ¡Feliz Año Nuevo! :)
5 votos
@Alexis la formulación fue pobre. Para variables aleatorias independientes, Var(X+Y) = Var(X)+Var(Y). Este hecho se utiliza en muchos lugares (conduce a los conocidos términos $\sqrt{n}\,$ al estandarizar fórmulas que involucran medias, como en estadísticas t de una muestra por ejemplo). No hay un hecho general correspondiente para la desviación media.
1 votos
Trivium: Para cualquiera que se sienta confundido por el título del libro citado, sepa que O level (que significa Nivel Ordinario) era el nombre de una serie de exámenes que generalmente se tomaban a los 16 años aproximadamente en Gran Bretaña y algunos otros países.