Lo primero que hay que entender es que la desviación estándar (std) es diferente de desviación media absoluta . Estos dos definen diferentes propiedades matemáticas sobre los datos.
A diferencia de la desviación media absoluta, la desviación estándar (std) pesa más a los valores que se alejan de la media, lo que se hace elevando al cuadrado los valores de diferencia.
Por ejemplo, para los siguientes cuatro puntos de datos: \begin{array}{|c|c|c|} \hline Data (x)& |x - mean| & (x-mean)^2 \\ \hline 2 & 2 & 4\\ \hline -2 &2 &4\\ \hline -6 &6 &36\\ \hline 6 &6 &36\\ \hline \sum x =0 & \sum (|x-mean|) = 16 & \sum (x-mean)^2 = 80 \end{array}
desviación media absoluta (aad) $= 16/4 = 4.0$ y
Desviación estándar (std) = $\sqrt{80/4} = \sqrt 20 = 4.47 $
En los datos, hay dos puntos que están a 6 distancias de la media, y dos puntos que están a 2 distancias de la media. Por lo tanto, la desviación de 4,47 tiene más sentido que 4.
Dado que la observación total es siempre $N$ para calcular la std no estamos buceando por $\sqrt N$ En cambio, dividimos la varianza total por $N$ y tomar su raíz cuadrada, para llevarla a la misma unidad que los datos originales.