47 votos

¿Por qué es tan genial elevar los números al cuadrado (en términos de encontrar la desviación estándar)?

Cuando queremos encontrar la desviación estándar de $\{1,2,2,3,5\}$ lo hacemos

$$\sigma = \sqrt{ {1 \over 5-1} \left( (1-2.6)^2 + (2-2.6)^2 + (2-2.6)^2 + (3-2.6)^2 + (5 - 2.6)^2 \right) } \approx 1.52$$ .

¿Por qué hay que elevar los números al cuadrado y luego a la raíz cuadrada?

6voto

dsims Puntos 842

La pregunta parece plantearse desde un punto de vista estadístico.

En estadística, la desviación estándar (muestral) se utiliza como medida de la dispersión de los datos. Tiene muchas propiedades agradables, pero, como han dicho otros, el motivo por el que la elegimos suele ser la conveniencia.

La conveniencia proviene del hecho de que a menudo queremos minimizar la dispersión. En el caso de la desviación estándar, estos problemas de minimización suelen tener soluciones explícitas, mientras que para otras medidas de dispersión hay que recurrir a métodos numéricos en un grado mucho mayor. Además, las soluciones explícitas simplifican mucho la teoría estadística.

Sin embargo, tiene sus inconvenientes y no es la única medida de dispersión utilizada en la práctica. Un gran inconveniente es que es sensible a los valores atípicos de los datos. Si al conjunto de datos {1,2,2,3,5} se le añade el punto 100, la desviación estándar cambia mucho. No es la mejor medida para datos muy sesgados, o datos de distribuciones con colas pesadas.

Una alternativa es el rango intercuartil, la distancia entre el tercer y el primer cuartil, y la distancia media absoluta a la mediana es otra.

Véase el artículo de la wikipedia sobre Estadísticas robustas para más información.

4voto

Matthew Puntos 111

He aquí una explicación sencilla: La desviación estándar como "medida de dispersión" es la compañera natural de la media aritmética como "estadística central".

Supongamos que nos dan $n+1$ medidas (digamos longitudes) $x_0 \le x_1 \le \cdots \le x_{n},$ y desea elegir un único valor $x^*$ para representarlos. Necesitamos una métrica para saber lo bueno que es un $x^*$ es. Entonces elegimos el valor que minimiza la "discrepancia agregada".

  • Si nuestra métrica es $\sum |x_i-x^*|,$ entonces es mejor tomar $x^*=x_{n/2}$ (la mediana) para incluso $n$ y cualquier $x_{(n-1)/2} \le x^* \le x_{(n+1)/2}$ para impar $n$ . Quizá sea una lástima que sólo uno o dos de los $x_i$ realmente importa.

  • Por supuesto, para $\sum(x_i-x^*)^2$ el único mínimo se produce para la conocida media aritmética $x^*=\frac{\sum x_i}{n+1}.$ Preferimos utilizar la métrica $\sqrt{\sum(x_i-x^*)^2}$ Ya que la "dispersión" es la misma para medir en pulgadas que en pies (y las unidades son correctas). También hay razones para dividir por $n+1$ o por $n,$ pero nada de esto cambia el valor de minimización y la pregunta era sobre el cuadrado.

  • Para $\sum|x_i-x^*|^p$ con diferentes $p$ obtenemos la mediana estándar como $p \rightarrow 1^+$ y $\frac{x_0+x_n}2$ como $p \rightarrow \infty.$

  • Supongo que el modo resultaría de llamar a la discrepancia $0$ o $1$ según $x_i = x^*$ o $x_i \neq x^*.$

  • ¿Podría $\sum \ln|x_i-x^*|$ (de forma equivalente, $e^{\sum \ln|x_i-x^*|}$ ) dan la media geométrica $\sqrt[n+1]{\prod{x_i}}?$

  • Puede que no sea difícil encontrar otras métricas que den lugar a la media armónica $$\frac1{\sum \frac1{x_i}},$$ y tal vez incluso la Junta General de Accionistas.

1voto

Neall Puntos 12075

Con la desviación estándar definida, se obtienen resultados interesantes como el Teorema de Chebyshev: para cualquier distribución y k>1, como máximo 1/k^2 de los datos quedan fuera de k desviaciones estándar de la media. Así, por ejemplo, para cualquier distribución, como máximo una cuarta parte de los datos se encuentra a más de dos desviaciones estándar de la media, y como máximo el 12% se encuentra a más de tres desviaciones estándar.

Esta y otras ventajas teóricas provienen de la larga respuesta que dio Mark4483. Estas cosas son importantes para desarrollar modelos de inferencia.

1voto

maxtopus Puntos 90

Piensa en la media/expectativa $m$ como el número para el que alguna definición de $\text{variance}(\{x_i-m\})$ se minimiza. El $m$ que logra el mínimo de un cuadrático la varianza es la único solución de un lineal ecuación. Las varianzas no cuadráticas dan lugar a medias/expectativas difíciles de calcular, y a veces no únicas. Por lo tanto, se podría decir que la respuesta es que 2=1+1.

0voto

edtechdev Puntos 180

La varianza de la población, E([X-E(X)]^2), puede estimarse fácilmente de forma insesgada mediante la varianza de la muestra, (n-1)^{-1} \sum (X_i- \bar {X})^2, donde la suma es de i=1 a i=n. "Insesgada" significa que si las X_i son copias i.i.d. de X, entonces la expectativa de la varianza de la muestra (por un cálculo directo directo) es la varianza de la población.

Que yo sepa, no se puede hacer nada en absoluto para los valores absolutos. Incluso para potencias mayores que 2, se podría construir un estimador insesgado más complicado. Dos es el caso más sencillo, y tiene mucho interés: el teorema del límite central, para empezar. No estoy seguro de hasta qué punto la teoría L^2 se generaliza a la teoría L^2k, pero hasta donde yo sé no existe ninguna razón de peso para considerarlo. Tal vez con k más alto, las grandes desviaciones tienen un peso aún mayor, y aplicaciones particulares pueden beneficiarse de su estudio. Sin embargo, la varianza habitual es un buen punto de partida. Existen condiciones bajo las cuales se puede recuperar una variable aleatoria X si se conoce todo de sus momentos, E(X^p) para p = 1, 2, 3, .... Desde esta perspectiva, uno podría considerar la varianza, E(X^2)-E(X)^2, una función de los dos primeros momentos, por la misma razón que uno puede mirar una aproximación de Taylor de segundo grado de sen - es el más simple, y usted puede mirar a otros términos si usted necesita saber más.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X