40 votos

¿Por qué se eleva la varianza al cuadrado?

La desviación media absoluta es:

i=1n|xix¯|n

La varianza es: i=1n(xix¯)2n1

  • Entonces, la desviación media y la varianza están midiendo lo mismo, sin embargo, la varianza requiere elevar al cuadrado la diferencia. ¿Por qué? Al elevar al cuadrado siempre obtenemos un valor no negativo, pero el valor absoluto también es no negativo.
  • ¿Por qué no es |xix¯|2, entonces? Elevar al cuadrado simplemente agranda, ¿por qué necesitamos hacer esto?

Una pregunta similar se encuentra aquí, pero la mía es un poco diferente.

Gracias.

4voto

Ya Basha Puntos 130

La varianza es, como dices, una medida de desviación. O, más bien, la desviación estándar (la raíz cuadrada de la varianza) es una medida de desviación. Por lo tanto, realmente debes comparar la desviación estándar y la desviación promedio.

La diferencia es la siguiente: Si di=|xix¯| son las desviaciones de valor absoluto, entonces la desviación promedio es d1+d2++dnn mientras que la desviación estándar es d12+d22++dn2n El promedio normal utiliza lo que se llama la media aritmética, y la desviación estándar utiliza lo que se llama la media cuadrática. No es muy difícil demostrar que, siempre y cuando no todos los di sean iguales, la desviación estándar es estrictamente mayor.

Por lo tanto, la desviación estándar se ve más afectada por los valores atípicos que la desviación promedio. Eso es realmente todo lo que hay que saber al respecto.

3voto

djeidot Puntos 2143

No miden lo mismo. La desviación media absoluta y la desviación estándar miden lo mismo (nota la similitud en sus nombres).

La varianza es conveniente porque satisface la propiedad de que la varianza de variables aleatorias independientes es la suma de las varianzas.

3voto

zigarrre Puntos 6

En primer lugar, ||2 es exactamente lo mismo que ()2 para x real. Como mencionaste, tienen algunas características similares pero para muchos problemas que surgen de la optimización que involucra densidades gaussianas, el resultado óptimo se logra mediante el cuadrado. Puede que quieras echar un vistazo al detector de Viterbi, por ejemplo, o dar otro ejemplo de la teoría de estimación, que es el detector de energía.

Todavía se puede utilizar la desviación absoluta de la muestra en lugar de la varianza de la muestra y se puede obtener un rendimiento muy bueno, pero para los ejemplos que di, el resultado NO será óptimo.

2voto

Stef Puntos 17114

Un caso similar surge en la regresión lineal donde se utiliza el "método de mínimos cuadrados", en lugar por ejemplo de un (ficticio) "método de mínimos valores absolutos". En ese caso, la razón es que elevar al cuadrado tiene mejores propiedades en relación a la derivada (minimizando la variabilidad).

En el caso anterior se aplican razones similares, que tienen que ver con estimar el sesgo (de la medida de la muestra correspondiente) o realizar otros cálculos como determinar la distribución de una estadística de muestra. Además, elevar al cuadrado el valor absoluto es lo mismo que elevar al cuadrado el valor en sí, es decir, |xix¯|2=(xix¯)2 por lo que esta alteración no conlleva una diferencia notable.

1voto

TriFar Puntos 23

Porque i=1nxix¯=(i=1nxi)nx¯=nx¯nx¯=0; la distancia promedio de la media debe ser cero, por definición (la suma de todos los valores = la media por el número de valores.) Sin embargo, si se elevan al cuadrado, los valores que están por debajo de la media no contribuyen 'negativamente' a la suma, cancelando los positivos. Por lo tanto, obtienes la suma de las distancias reales al cuadrado (que luego puedes sacar la raíz cuadrada para volver a las unidades originales.) También podrías usar un valor absoluto para hacer esto.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X