He estado estudiando estadísticas descriptivas y me está costando entender la intuición real detrás de la desviación estándar. Estoy tratando de tener una sensación práctica al respecto, así que estoy intentando sacar conclusiones de una distribución de 20 números, del 1 al 20. Sé que la media es 10.5 y la desviación promedio absoluta es 5, lo cual es bastante intuitivo.
Ahora, al tomar la desviación estándar obtengo el valor 5.77 lo cual aún tiene sentido si pienso en ello como la desviación euclidiana promedio de la media. Así que me imagino sumando distancias ortogonales y luego promediándolas $\frac{\sum(x_i-\bar x)^2}{n}$ y al final sacando la raíz cuadrada de eso para obtener la distancia promedio real. La fórmula tiene sentido desde una perspectiva euclidiana. Así que dicho todo esto, mis preguntas:
1) ¿Por qué una distancia euclidiana promedio sería más precisa que una desviación absoluta de la media? De hecho, creo que la desviación promedio absoluta es más precisa ya que no infiere ninguna dirección de los valores. Al tomar la distancia euclidiana, estoy prácticamente diciendo que cada valor está colocado en un ángulo de 90° entre sí. Eso no suena correcto. Entonces, ¿por qué la distancia euclidiana? (Soy consciente de este artículo, pero si alguien realmente pudiera explicar qué es eficiencia, sería de gran ayuda: https://www.leeds.ac.uk/educol/documents/00003759.htm)
2) Si la ventaja de usar SD es debido a toda la matemática que hemos desarrollado alrededor de las formas de distribución normal (68%, 95%, 99,7%...) ¿no sería mejor simplemente reescribir ese modelo con la nueva desviación promedio?
3) Probablemente postearé otra pregunta en el futuro sobre esto, pero al calcular el error estándar, esta desviación estándar parece empeorar aún más, ya que necesitamos correcciones para poblaciones finitas. ¿Tiene esto algún sentido?
1 votos
Vale la pena leer math.stackexchange.com/questions/717339/why-is-variance-squared y stats.stackexchange.com/questions/118/… - a menudo es la varianza la que tiene las propiedades agradables; su raíz cuadrada (la desviación estándar) luego se beneficia de estar en las mismas unidades que los datos originales y, por lo tanto, se convierte en un parámetro de escala
0 votos
Creo que la publicación lamentablemente eliminada de @ThomasAndrews plantea puntos interesantes, al igual que el enlace en el comentario de Henry. Además, en general, cuando se habla de 'intuición', hay que darse cuenta de que lo que no impacta a una persona podría ser una revelación impresionante para otra. La intuición es opinión. Por lo tanto, puede que no sea productivo discutir sobre la validez de la intuición.