Processing math: 100%

11 votos

¿Por qué hay un cuadrado en MSE (error cuadrático medio)?

Por favor, perdóname por esa pregunta para principiantes, ya que estoy aprendiendo estadísticas. & aprendizaje automático.

Estoy tratando de entender el error cuadrático medio.

Entiendo el "error medio", la media de los errores entre los valores reales y los valores predichos, ¿qué me preocupa por qué tomamos el cuadrado de los errores?

Si solo se trata de mantener los valores positivos, entonces, ¿por qué no solo tomamos valores absolutos?

Solo quiero entender qué valores aporta a la función de pérdida real.

Gracias

9voto

Vitaly Zdanevich Puntos 95

MSE tiene algunas propiedades deseables tales como la facilitación de la diferenciabilidad (como @user2974951 comentarios) para su posterior análisis. La diferenciabilidad de la función objetivo es, en general, muy importante para realizar cálculos analíticos. Tomando valores absolutos se llama Error Absoluto medio (MAE en el corto). También tiene aplicaciones. No es como que siempre preferimos MSE o MAE. Otra razón, podría penalizar a los grandes errores más, porque si el error es grande, su plaza es mucho más grande. Por ejemplo, si algún término de error, ei es de 999, y el otro, ej, 50; y si vamos a elegir que el plazo para disminuir la cantidad de 1, MAE puede elegir cualquiera de ellos. Pero, MSE, apunta a la más grande desde la plaza de la disminución es mayor.

5voto

winperikle Puntos 8

Si ˆθ es un estimador del parámetro θ , a continuación, el MSE E[(ˆθθ)2] es la suma de la varianza de la ˆθ y el cuadrado del sesgo :

E[(ˆθθ)2]=E[ˆθ22ˆθθ+θ2]=E[ˆθ2]2θE[ˆθ]+θ2=E[ˆθ2]E[ˆθ]2+E[ˆθ]22θE[ˆθ]+θ2=Var(ˆθ)+(E[ˆθ]θ)2=Var(ˆθ)+Bias(ˆθ)2

El MSE es de dos características importantes de un estimador : sesgo y la varianza. Un estimador puede tener un pequeño sesgo, pero si tiene una gran variación no es muy interesante. Por otro lado, un estimador puede ser muy precisa, me.e pequeña variación, pero si tiene un gran sesgo es también no muy interesante. El MSE toma tanto en cuenta.

Por otra parte, una propiedad de la MSE es que si ˆθ depende de n, el tamaño de la muestra, a continuación, si MSE(ˆθn)0 como n+ (por lo tanto la varianza y el sesgo converge a cero) ˆθn es consistente, yo.e converge en probabilidad a θ.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X