100 votos

¿Qué tiene de especial la desviación estándar?

De forma equivalente, sobre la varianza?

Me doy cuenta de que mide la dispersión de una distribución, pero muchas otras métricas podría hacer lo mismo (por ejemplo, el promedio de la desviación absoluta). ¿Cuál es su significado más profundo? Tiene

  • una particular interpretación geométrica (en el sentido de, por ejemplo, que la media es el punto de equilibrio de una distribución)?
  • cualquier otra interpretación intuitiva de que la diferencia de otras posibles medidas de dispersión?

¿Qué es tan especial acerca de lo que hace es actuar como un factor de normalización de en todo tipo de situaciones (por ejemplo, convertir la covarianza correlación)?

102voto

Tim Almond Puntos 1887

Hay una muy buena interpretación geométrica.

Las variables aleatorias de finito significa que forman un espacio vectorial. La covarianza es un útil producto interior en el espacio que. Oh, espera, eso no es del todo correcto: variables constantes son ortogonales a sí mismos en este producto, por lo que es muy positivo semi-definida. Así que, permítanme ser más preciso - en el cociente espacio formado por la relación de equivalencia "difiere por una constante", la covarianza es una verdadera interior del producto. (Si el cociente espacios son un concepto desconocido, sólo se centran en el espacio vectorial de cero significa que las variables; se obtiene el mismo resultado en este contexto).

A la derecha, vamos a llevar a cabo. En la norma en el interior de este producto induce, la desviación estándar es una variable de longitud, mientras que el coeficiente de correlación entre dos variables (su covarianza dividida por el producto de sus desviaciones estándar) es el coseno del ángulo "" entre ellos. Que el coeficiente de correlación es en $[-1,\,1]$ es entonces una reformulación del espacio vectorial es de Cauchy-Schwarz desigualdad.

17voto

John Coleman Puntos 121

Me lo tomo como hegemónico que la desviación estándar es importante en la distribución normal, ya que la desviación estándar (o desviación) es uno de sus parámetros (aunque se podría sin duda ser reparameterized en varias formas). Por el Teorema del Límite Central, la distribución normal es a su vez relevantes para la comprensión de cualquier distribución: Si $X$ es una variable normal con media de $\mu$ y la desviación estándar $\sigma$, entonces para grandes $n$

$$\frac{\overline{X} - \mu}{\frac{\sigma}{\sqrt{n}}}$$

es aproximadamente normal estándar. Ninguna otra medida de dispersión puede relacionar $X$ con la distribución normal. Dicho simplemente, el Teorema Central del Límite en sí y de por sí garantiza que la desviación estándar juega un papel destacado en las estadísticas.

2voto

homestoned Puntos 16

Una característica interesante de la desviación estándar es su conexión con la raíz del error cuadrático. Esta prueba mide qué tan bien un predictor en la predicción de los valores. La raíz del error cuadrático de la media como un predictor es la desviación estándar, y este es el mínimo error cuadrático medio que se puede obtener con una constante predictor.

(Esto, por supuesto, cambia la pregunta de por qué la raíz del error cuadrático medio es muy interesante. Me resulta un poco más intuitiva que la desviación estándar, a pesar de que: se puede ver como el $L_2$ norma del vector de error, corregido por el número de puntos).

2voto

Rozwel Puntos 1114

Cuando la definición de "desviación estándar", queremos de alguna forma, para tomar un montón de desviaciones de la media y cuantificar lo grandes que son típicamente mediante un único número en las mismas unidades que las desviaciones de sí mismos. Pero cualquiera que sea la definición de "desviación estándar" induce a la correspondiente definición de "media" porque queremos que nuestra elección de "significa" para siempre minimizar el valor de nuestra "desviación estándar" (intuitivamente, queremos definir "significa" ser "middlemost" punto de medida por "desviación estándar"). Sólo por la definición de "desviación estándar" en la forma habitual de hacer recuperar la media aritmética, mientras que todavía tiene una medida en el derecho de unidades. (Sin entrar en detalles, el punto clave es que la cuadrática se convierte en lineal cuando tomamos la derivada para encontrar su punto crítico.)

Si queremos utilizar algún otro medio, podemos encontrar otro tipo de "desviación estándar" que va a coincidir que la media (el progreso es algo análogo a la integración), pero en la práctica es más fácil para transformar los datos de modo que la media aritmética es la adecuada.

2voto

Eric Towers Puntos 8212

La distribución normal tiene la máxima entropía entre real distribuciones soportadas en $(-\infty, \infty)$ con desviación estándar (de forma equivalente, la varianza). (De referencia.) En consecuencia, si la única cosa que sabemos acerca de una distribución real apoyado en $\mathbb{R}$ es su media y varianza de la distribución que supone el mínimo de información previa es la distribución normal.

Yo no tienden a pensar en la declaración sobre el importante hecho. Es más: distribuciones normales aparecen con frecuencia y conocer el parámetro de localización (media) es razonable. Entonces, ¿qué más tengo que saber hacer la más mínima presunta modelo de la distribución normal? La dispersión (varianza).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X