La fórmula para la desviación estándar de números números es igual a la fórmula de la distancia entre dos puntos en números dimensiones. Podría alguien explicar ¿por qué es y cómo estos se relacionan?
Respuesta
¿Demasiados anuncios?Cualquier conjunto en el que puede definir una 'distancia' de la función que cumple una serie de propiedades (las distancias son positivas, simétrica y aditivos). Es llamado un espacio Métrico. $\mathbb{R}^k$ es un espacio métrico con la distancia de la función que normalmente se define a ser $d(\mathbf{x},\mathbf{y}) = |\mathbf{x}-\mathbf{y}|$, la norma de la diferencia (aunque podemos usar cualquier función de distancia queremos siempre que cumplan con los 3 propiedades, más sobre esto más adelante).
La norma se define a ser $|\mathbf{x}| = \sqrt{\sum_{i=1}^n x_i^2}$. Ese derecho no se ve extrañamente familiar, usted podría pensar. Así que si usted tiene algunos de los valores observados $\mathbf{x}=x_1,\ldots,x_n$ y si nos encontramos con la distancia entre los valores observados y su media, $\mu$ tenemos $d(\mathbf{x},\mu) = |\mathbf{x}-\mu| = \sqrt{\sum_{i=1}^n (x_i-\mu)^2}$ que es casi como la desviación estándar (falta un $1/n$ o $1/(n-1)$. Sin embargo, fácilmente podemos redefinir nuestra función de distancia para ser algo parecido a $d(\mathbf{x},\mathbf{y}) = +\sqrt{1/n}|\mathbf{x}-\mathbf{y}|$ y todavía tiene las tres propiedades necesarias para hacer de $\mathbb{R}^k$ un espacio métrico.
Usted puede estar más familiarizado con las distancias en un 2-dimensional espacio como $\mathbb{R}^2$. En este espacio podemos utilizar la misma función de distancia que el anterior, pero ya que en lugar de $k$ componentes sólo tenemos 2 la fórmula se simplifica a $d((x_1,y_1), (x_2,y_2)) = \sqrt{(x_1-x_2)^2+(y_1-y_2)^2}$