En algún sentido, esta es una pregunta trivial, ¡Pero en otro sentido, en realidad es bastante profunda!
-
Como otros han mencionado, tomar la raíz cuadrada implica que $\operatorname{Stdev}(X)$ tiene las mismas unidades que $X$.
-
Tomar la raíz cuadrada te da homogeneidad absoluta también conocida como escalabilidad absoluta. Para cualquier escalar $\alpha$ y variable aleatoria $X$, tenemos: $$ \operatorname{Stdev}[\alpha X] = |\alpha| \operatorname{Stdev}[X]$$ Homogeneidad absoluta es una propiedad requerida de una norma. La desviación estándar se puede interpretar como una norma (en el espacio vectorial de variables aleatorias con media cero) de manera similar a como $\sqrt{x^2 + y^2+z^2}$ es la norma euclidiana estándar en un espacio tridimensional. La desviación estándar es una medida de distancia entre una variable aleatoria y su media.
Desviación estándar y la norma $L_2$
Caso de dimensión finita:
En un espacio vectorial dimensional $n$, la norma euclidiana estándar también conocida como la $L_2$ norma se define como:
$$\|\mathbf{x}\|_2 = \sqrt{\sum_i x_i^2}$$
De manera más amplia, la $p$-norma $\|\mathbf{x}\|_p = \left(\sum_i |x_i|^p \right)^{\frac{1}{p}}$ toma la raíz $p$ para obtener homogeneidad absoluta: $\|\alpha \mathbf{x}\|_p = \left( \sum_i |\alpha x_i|^p \right)^\frac{1}{p} = | \alpha | \left( \sum_i |x_i|^p \right)^\frac{1}{p} = |\alpha | \|\mathbf{x}\|_p $.
Si tienes pesos $q_i$ entonces la suma ponderada $\sqrt{\sum_i x_i^2 q_i}$ también es una norma válida. Además, es la desviación estándar si $q_i$ representan probabilidades y $\operatorname{E}[\mathbf{x}] \equiv \sum_i x_i q_i = 0$
Caso de dimensión infinita:
En un Espacio de Hilbert infinito dimensional también podemos definir la $L_2$ norma:
$$ \|X\|_2 = \sqrt{\int_\omega X(\omega)^2 dP(\omega) }$$
Si $X$ es una variable aleatoria con media cero y $P$ es la medida de probabilidad, ¿cuál es la desviación estándar? Es la misma: $\sqrt{\int_\omega X(\omega)^2 dP(\omega) }$.
Resumen:
Tomar la raíz cuadrada significa que la desviación estándar cumple con la homogeneidad absoluta, una propiedad requerida de una norma.
En un espacio de variables aleatorias, $\langle X, Y \rangle = \operatorname{E}[XY]$ es un producto interno y $\|X\|_2 = \sqrt{\operatorname{E}[X^2]}$ la norma inducida por ese producto interno. Así que la desviación estándar es la norma de una variable aleatoria sin media: $$\operatorname{Stdev}[X] = \|X - \operatorname{E}[X]\|_2$$ Es una medida de la distancia desde la media $\operatorname{E}[X]$ hasta $X$.
(Punto técnico: mientras que $\sqrt{\operatorname{E}[X^2]}$ es una norma, la desviación estándar $\sqrt{\operatorname{E}[(X - \operatorname{E}[X])^2]}$ no es una norma sobre variables aleatorias en general porque un requisito para un espacio vectorial normado es $\|x\| = \mathbf{0}$ si y solo si $x = \mathbf{0}$. Una desviación estándar de 0 no implica que la variable aleatoria sea el elemento cero.)
0 votos
Estrechamente relacionado: stats.stackexchange.com/questions/35123/…
2 votos
Piense en la desviación estándar como una norma de vector euclidiana y luego la varianza como el cuadrado. Esta definición de varianza y desviación estándar resulta tener propiedades analíticas útiles.