Mi intuición es que la desviación típica es: una medida de la dispersión de los datos.
Tienes razón al decir que la amplitud o el estrechamiento dependen de la hipótesis subyacente sobre la distribución de los datos.
Advertencia: Una medida de dispersión es más útil cuando la distribución de los datos es simétrica en torno a la media y tiene una varianza relativamente cercana a la de la distribución Normal. (Esto significa que es aproximadamente Normal).
En el caso de que los datos sean aproximadamente Normales, la desviación típica tiene una interpretación canónica:
- Región: Media de la muestra +/- 1 desviación típica, contiene aproximadamente el 68% de los datos.
- Región: Media de la muestra +/- 2 desviaciones estándar, contiene aproximadamente el 95% de los datos.
- Región: Media de la muestra +/- 3 desviaciones estándar, contiene aproximadamente el 99% de los datos.
(véase el primer gráfico en Wiki )
Esto significa que si sabemos que la media poblacional es 5 y la desviación típica es 2,83 y suponemos que la distribución es aproximadamente Normal, te diría que estoy razonablemente seguro de que si hacemos (muchas) observaciones, sólo el 5% serán menores que 0,4 = 5 - 2*2,3 o mayores que 9,6 = 5 + 2*2,3.
Observa cuál es el impacto de la desviación típica en nuestro intervalo de confianza. (a mayor dispersión, mayor incertidumbre)
Además, en el caso general en el que los datos no son ni siquiera aproximadamente normales, pero sí simétricos, se sabe que existen unas $\alpha$ para lo cual:
- Región: Media de la muestra +/- $\alpha$ desviación típica, contiene aproximadamente el 95% de los datos
Puede aprender el $\alpha$ de una submuestra, o suponer $\alpha=2$ y esto te da a menudo una buena regla empírica para calcular mentalmente qué observaciones futuras esperar, o cuáles de las nuevas observaciones pueden considerarse atípicas. (No obstante, hay que tener en cuenta la advertencia).
No veo cómo se supone que hay que interpretarlo. ¿Significa 2,83 que los valores están muy dispersos o que están todos muy agrupados en torno a la media?
Supongo que toda pregunta que pregunte "ancho o estrecho", debería contener también: "¿en relación con qué?". Una sugerencia podría ser utilizar como referencia una distribución bien conocida. Dependiendo del contexto, podría ser útil pensar: "¿Es mucho más amplia o estrecha que una Normal/Poisson?".
EDITAR: Basándome en una pista útil en los comentarios, un aspecto más sobre la desviación estándar como medida de distancia.
Otra intuición de la utilidad de la desviación típica $s_N$ es que es una medida de distancia entre los datos de la muestra $x_1,… , x_N$ y su media $\bar{x}$ :
$s_N = \sqrt{\frac{1}{N} \sum_{i=1}^N (x_i - \overline{x})^2}$
A modo de comparación, el error cuadrático medio (ECM), una de las medidas de error más populares en estadística, se define como:
$\operatorname{MSE}=\frac{1}{n}\sum_{i=1}^n(\hat{Y_i} - Y_i)^2$
Cabe preguntarse ¿por qué la función de distancia anterior? ¿Por qué las distancias al cuadrado, y no las distancias absolutas, por ejemplo? ¿Y por qué tomamos la raíz cuadrada?
Disponer de funciones cuadráticas de distancia, o de error, tiene la ventaja de que podemos diferenciarlas y minimizarlas fácilmente. En cuanto a la raíz cuadrada, contribuye a la interpretabilidad, ya que convierte el error a la escala de los datos observados.
3 votos
Este la pregunta está relacionada (aunque no es idéntica) a stats.stackexchange.com/q/81986/3277 y otro enlazado allí.
1 votos
Indica una distancia "típica" con respecto a la media (la distancia RMS). Lo que la hace "grande" o "pequeña" depende de su criterios. Si se trata de medir tolerancias de ingeniería, puede ser enorme. En otros contextos, la misma desviación típica puede considerarse bastante pequeña.