67 votos

Desviación media absoluta vs. desviación estándar

En el libro de texto "New Comprehensive Mathematics for O Level" de Greer (1983), veo que la desviación promedio se calcula de la siguiente manera:

Suma las diferencias absolutas entre los valores individuales y la media. Luego obtén su promedio. A lo largo del capítulo se utiliza el término desviación media.

Pero recientemente he visto varias referencias que utilizan el término desviación estándar y esto es lo que hacen:

Calculan los cuadrados de las diferencias entre los valores individuales y la media. Luego obtienen su promedio y finalmente la raíz de la respuesta.

Probé ambos métodos en un conjunto común de datos y sus respuestas difieren. No soy estadístico. Me confundí al intentar enseñar desviación a mis hijos.

Entonces, en resumen, ¿los términos desviación estándar y desviación media son lo mismo o es incorrecto mi antiguo libro de texto?

4 votos

Las dos cantidades difieren. Ponderan los datos de manera diferente. La desviación estándar será mayor y está relativamente más afectada por los valores más grandes. La desviación estándar (especialmente la versión con denominador n) se puede entender como una desviación cuadrática media. Las desviaciones estándar son más comúnmente utilizadas.

10 votos

Muy relacionado: .

0 votos

Gary Kader tiene una forma divertida de enseñar a los niños a derivar la desviación media absoluta.

38voto

justwondering Puntos 28

Ambos responden a qué tan lejos están distribuidos tus valores alrededor de la media de las observaciones.

Una observación que está 1 por debajo de la media está igualmente "lejos" de la media que un valor que está 1 por encima de la media. Por lo tanto, debes ignorar el signo de la desviación. Esto se puede hacer de dos maneras:

  • Calcular el valor absoluto de las desviaciones y sumarlas.

  • Elevar al cuadrado las desviaciones y sumar estos cuadrados. Debido al cuadrado, le das más peso a las desviaciones altas, por lo que la suma de estos cuadrados será diferente de la suma de las medias.

Después de calcular la "suma de desviaciones absolutas" o la "raíz cuadrada de la suma de desviaciones al cuadrado", promedias para obtener la "desviación media" y la "desviación estándar" respectivamente.

La desviación media rara vez se utiliza.

0 votos

Entonces, ¿cuando alguien dice simplemente 'desviación', se refieren a 'desviación estándar'?

0 votos

Estoy de acuerdo en que el 1 arriba o abajo indicaría un 'cambio' o 'dispersión' significativos desde el punto de vista de un hombre común. Pero elevándolo al cuadrado daría valores más grandes y eso podría no ser mi 'cambio real'. Tal vez estoy equivocado, pero así es como lo veo :/

0 votos

La mayoría de las veces se utiliza el término desviación estándar (raíz cuadrada de la varianza). Calcular los cuadrados se hace típicamente, ya que facilita muchas otras operaciones.

15voto

Prakash K Puntos 321

Ambos miden el mismo concepto, pero no son iguales.

Estás comparando $\frac{1}{n} \sum |x_i-\bar{x}|$ con $\sqrt{\frac{1}{n} \sum (x_i-\bar{x})^2}$. No son iguales por dos razones:

En primer lugar, el operador de raíz cuadrada no es lineal, es decir, $\sqrt{a+b} \neq \sqrt{a} + \sqrt{b}$. Por lo tanto, la suma de desviaciones absolutas no es igual a la raíz cuadrada de la suma de desviaciones al cuadrado, aunque la función absoluta se puede representar como la función cuadrada seguida de una raíz cuadrada:
$\sum|x_i-\bar{x}| = \sum \sqrt{(x_i-\bar{x})^2} \neq \sqrt{\sum(x_i-\bar{x})^2}$
ya que la raíz cuadrada se toma después de que se haya calculado la suma.

En segundo lugar, $n$ también está bajo la raíz cuadrada en el cálculo de la desviación estándar.

Intenta calcular $\frac{1}{n}\sum \sqrt{(x_i-\bar{x})^2}$ - debería arrojar la misma respuesta que la desviación media y ayudarte a comprender.

La razón por la que se prefiere la desviación estándar es porque es matemáticamente más fácil de trabajar más adelante, cuando los cálculos se vuelven más complicados.

5 votos

El valor absoluto de una suma no, en general, es lo mismo que la suma de los valores absolutos! Ni el cuadrado, la raíz cuadrada, ni las funciones absolutas son lineales, por lo cual la suma después de aplicar la función es diferente de aplicar la función después de tomar la suma.

0 votos

@AmeliaBR ¡por supuesto que tienes toda la razón!

0 votos

El resto del argumento era bueno, sin embargo, por eso decidí editar la declaración problemática.

14voto

Uri Puntos 111

@itsols, agregaré a la importante noción de Kasper que La desviación media rara vez se utiliza. ¿Por qué se considera que la desviación estándar es generalmente una mejor medida de variabilidad que la desviación media absoluta? Porque el promedio aritmético es el lugar del mínimo sumatorio de desviaciones al cuadrado (y no del sumatorio absoluto) de él.

Supongamos que quiere evaluar el grado de altruismo. Entonces probablemente no preguntará a una persona cuánto está dispuesta a dar dinero en una "situación general" de la vida. Más bien, elegirá preguntar cuánto está dispuesta a hacerlo en una situación constreñida, donde tiene los recursos mínimos posibles para su propia vida. Es decir, ¿cuál es la cantidad de altruismo individual en la situación cuando esa cantidad es el mínimo del individuo?

De la misma manera, ¿cuál es el grado de variabilidad de estos datos? Intuitivamente, el mejor índice de medición para ello es aquel que se minimiza (o maximiza) hasta el límite en este contexto. El contexto es "alrededor de la media aritmética". Entonces la desviación estándar es la mejor elección en este sentido. Si el contexto fuera "alrededor de la mediana", entonces la desviación media |absoluta| sería la mejor elección, porque la mediana es el lugar del mínimo sumatorio de desviaciones absolutas de ella.

7 votos

Su justificación para la desviación estándar basada en el Locus es circular. Está justificando la desviación estándar al darle especial importancia a la media aritmética: todo esto muestra es que tienen una relación, no que la desviación estándar sea especial. Uno también puede dar importancia a la mediana, que es el locus de la mínima suma de pérdida absoluta. La verdadera razón por la que la desviación estándar se usa más a menudo es porque las matemáticas son más fáciles de trabajar... además, es más fácil computacionalmente (tanto porque las medianas requieren "ordenación", como porque los cuadrados son más rápidos de calcular que las declaraciones condicionales). Filosóficamente, la desviación absoluta tiene un mayor valor.

11voto

AmeliaBR Puntos 348

Una cosa que vale la pena agregar es que la razón más probable por la que su libro de texto de 30 años utilizó la desviación media absoluta en lugar de la desviación estándar es que es más fácil de calcular a mano (sin cuadrar / raíces cuadradas). Ahora que las calculadoras son fácilmente accesibles para los estudiantes de secundaria, no hay razón para no pedirles que calculen la desviación estándar.

Todavía hay algunas situaciones en las que se utilizan desviaciones absolutas en lugar de desviaciones estándar en el ajuste de modelos complejos. Las desviaciones absolutas son menos sensibles a los valores atípicos extremos (valores lejos de la media / línea de tendencia) en comparación con las desviaciones estándar porque no cuadran esa distancia antes de sumarla a los valores de otros puntos de datos. Dado que los métodos de ajuste de modelos buscan reducir la desviación total de la línea de tendencia (según el método de cálculo de desviación), los métodos que utilizan la desviación estándar pueden terminar creando una línea de tendencia que se aleja de la mayoría de los puntos para estar más cerca de un valor atípico. El uso de desviaciones absolutas reduce esta distorsión, pero a costa de hacer que el cálculo de la línea de tendencia sea más complicado.

Esto se debe a que, como han señalado otros, la desviación estándar tiene propiedades matemáticas y relaciones que generalmente la hacen más útil en estadística. Pero "útil" nunca debe confundirse con perfecto.

3 votos

Solo curiosidad, ¿cuáles son las "propiedades matemáticas" que hacen que la desviación estándar sea más útil que la desviación media absoluta? Excelente respuesta por cierto.

1 votos

@pongba La desviación estándar es intrínseca a muchos modelos estadísticos que asumen variación aleatoria de múltiples efectos que pueden cancelarse mutuamente (también conocidos como datos distribuidos normalmente). Esto incluye la precisión del muestreo (margen de error) al utilizar una encuesta de una población grande.Si tus datos cumplen con este modelo, puedes estimar la probabilidad de obtener un valor a partir del número de desviaciones estándar de la media. Puedes calcular la desviación estándar de múltiples efectos independientes a partir de la desviación estándar de los componentes individuales. Ver también: en.m.wikipedia.org/wiki/Standard_deviation

2 votos

"La desviación media absoluta" sería mejor como "desviación media absoluta"

7voto

iliasfl Puntos 1440

Son medidas similares que intentan cuantificar la misma noción. Normalmente se utiliza la desviación estándar ya que tiene propiedades agradables, si se hace alguna suposición sobre la distribución subyacente.

Por otro lado, el valor absoluto en la desviación media causa algunos problemas desde una perspectiva matemática ya que no se puede diferenciar y no se puede analizar fácilmente. Alguna discusión aquí.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X