25 votos

¿Cómo determinar la precisión de la regresión? ¿Qué medida debe utilizarse?

Tengo un problema con la definición de la unidad de precisión en una tarea de regresión.

En tareas de clasificación es fácil calcular la sensibilidad o especificidad del clasificador porque la salida es siempre binaria {clasificación correcta, clasificación incorrecta}. Así que puedo contar las respuestas buenas/malas y, basándome en la matriz de confusión, calcular algunas medidas.

Pero en las tareas de regresión la salida es un número. Así que no puedo limitarme a decir si es correcto o incorrecto, sino que debo medir "cuánto me alejo de la solución verdadera".

Entonces, ¿cuál es la unidad de precisión en la tarea de regresión?

30voto

ssn Puntos 472

Debería preguntarse qué pretendía conseguir con su planteamiento de modelado.

Como bien ha dicho "qué lejos estoy de la verdadera solución" es un buen punto de partida (observe que esto también es cierto para la clasificación, sólo entramos en detalles cuando nos encontramos con la dicotomización, por lo general en el aprendizaje automático más orientado a CS, como árboles o SVM).

Así que vamos a medirlo, ¿vale? Si $x_i$ es la verdad y $\hat x_i$ la salida de su modelo, por ejemplo $i$ Aquí está el error:

$$\epsilon_i = x_i - \hat x_i$$

Se podría medir el error medio $\sum_i \epsilon_i$ Pero resulta que, al hacer eso, los errores positivos y negativos se anulan, con lo que no hay forma de saber el rendimiento real del modelo.

Por lo tanto, lo que la gente hace en general, es utilizar estas medidas:

  • Error al cuadrado:

    $$\text{SE}=\sum_i^n \epsilon_i^2$$

  • Error cuadrático medio:

    $$\text{MSE}=1/n \times \text{SE}$$

  • Error cuadrático medio:

    $$\text{RMSE}=\sqrt{\text{MSE}}$$

  • Error cuadrático medio relativo (no confundir con el RMSE, error cuadrático medio):

    $$\text{rMSE}={n-1\over n}{{\sum_i^n \epsilon_i^2}\over {\sum_i^n (x_i - \mathbb E(x))^2}}= {\text{MSE} \over Var(x)}$$

  • $\text{R}^2$ :

    $$\text{R}^2=1 - \text{rMSE}$$

  • Error absoluto:

    $$\text{AE}=\sum_i^n \sqrt{\epsilon_i^2}=\sum_i^n |{\epsilon_i}|$$

  • Error absoluto medio:

    $$\text{MAE}=1/n \times \text{AE}$$

Y muchos, muchos otros. Puede encontrarlos en el sitio (véase, por ejemplo ¿Cómo interpretar las medidas de error? ).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X