40 votos

¿Motivación de la desviación estándar?

Vamos a tomar los números del 0 al 10. Su media es de 5, y el individuo desviaciones de 5
-5, -4, -3, -2, -1, 0, 1, 2, 3, 4, 5
Y por lo que el promedio (magnitud de) la desviación de la media es de $30/11 \aprox 2.72$.

Sin embargo, esta no es la desviación estándar. La desviación estándar es de $\sqrt{10} \approx 3.16$.

La primera media desviación es más simple y por mucho más intuitiva definición de "estándar de la desviación", así que estoy seguro de que es la primera definición de estadísticos del trabajo. Sin embargo, por alguna razón, se decidió adoptar la segunda definición en su lugar. ¿Cuál es el razonamiento detrás de esa decisión?

41voto

Jon Clegg Puntos 661

Su conjetura es correcta: mínimo absoluto de las desviaciones fue el método que prueban por primera vez en la historia. Los primeros en utilizarla fueron los astrónomos que estaban tratando de combinar observaciones sujeto a error. Boscovitch en 1755 publicado este método y una solución geométrica. Fue utilizado más tarde por Laplace en una 1789 trabajo en la geodesia. Laplace formulado el problema más matemáticamente y se describe una solución analítica.

Legendre parece ser el primero en utilizar mínimos cuadrados, haciendo así que tan pronto como 1798 para el trabajo en mecánica celeste. Sin embargo, él suministrados no probabilística de justificación. Una década más tarde, Gauss (en un 1809 tratado sobre el movimiento celeste, y las secciones cónicas) afirmó axiomáticamente que la media aritmética es la mejor forma de combinar observaciones, invoca el principio de máxima verosimilitud y, a continuación, mostraron que la distribución de la probabilidad de que la probabilidad es maximizada en la media debe ser proporcional a $\exp(-x^2 / (2 \sigma^2))$ (que ahora se llama un "Gaussiano") donde $\sigma$ cuantifica la precisión de las observaciones.

La probabilidad (cuando las observaciones son estadísticamente independientes) es el producto de estos términos de Gauss, la cual, debido a la presencia de la exponencial, es más fácil de maximizar minimizar los efectos negativos de su logaritmo. Hasta una constante aditiva, la negativa de registro del producto es la suma de los cuadrados (todo dividido por una constante de 2 $\sigma^2$, que no afectarán a la minimización). Por lo tanto, incluso históricamente, el método de mínimos cuadrados, íntimamente relacionadas con la probabilidad de cálculos y promedios. Hay un montón de otras moderno justificaciones de los mínimos cuadrados, por supuesto, pero esta derivación mediante Gauss-con la casi mágica aparición de la Gaussiana, que había aparecido por primera vez en 70 años a principios De Moivre del trabajo en las sumas de variables de Bernoulli (el Teorema del Límite Central)--es memorable.

Esta historia fue investigado, y es hábilmente narrada, por Steven Stigler, en su La Historia de las Estadísticas - La Medición de la Incertidumbre antes de 1900 (1986). Aquí simplemente he dado los aspectos más destacados de las partes de los capítulos 1 y 4.

13voto

Matt Dawdy Puntos 5479

El cuadrado es mejor que tomar el valor absoluto, por ejemplo, que esté suave. También conduce a una definición de la varianza que tiene buenas propiedades matemáticas, por ejemplo, es aditivo. Pero para mí el teorema de que realmente justifica el uso de la desviación estándar sobre la media del error absoluto es el teorema del límite central. El teorema del límite central es en el trabajo, siempre que medimos la media y la desviación estándar de una distribución que suponemos es normal (por ejemplo, las alturas en una población) y el uso que hacen predicciones acerca de la totalidad de la distribución, ya que una distribución normal está completamente especificado por su media y desviación estándar.

4voto

Michael Hardy Puntos 128804

$\newcommand{\var}{\operatorname{var}}$ Las desviaciones se aditivo: para variables aleatorias independientes $X_1,\ldots,X_n$, $$ \var(X_1+\cdots+X_n)=\var(X_1)+\cdots+\var(X_n). $$

Fíjate lo que esta hace posible: Decir que me tire una moneda de 900 veces. ¿Cuál es la probabilidad de que el número de cabezas que tengo es entre 440 y 455 inclusiva? Sólo tienes que encontrar el número esperado de cabezas ($450$), y la varianza del número de cabezas de ($225=15^2$), a continuación, encontrar la probabilidad normal (o de Gauss) de distribución con la expectativa de $450$ y una desviación estándar de $15$ entre $439.5$ y $455.5$. Abraham de Moivre hizo con lanzar una moneda en el siglo 18, lo primero que muestra que la curva en forma de campana es algo que vale la pena.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X