A menudo escucho acerca de la evaluación de un modelo de clasificación del rendimiento a través de la prueba de conjunto y la formación de un modelo en el conjunto de entrenamiento. Luego de la creación de 2 vectores, uno para la predicción de valores y uno de los verdaderos valores. Obviamente haciendo una comparación permite juzgar el rendimiento de la modelo por su poder predictivo usando cosas como el F-Score, Estadística Kappa, Precisión Y Recall, curvas ROC, etc.
Cómo se compara esto con la evaluación de la predicción numérica como la regresión? Supongo que podría entrenar el modelo de regresión en el conjunto de entrenamiento, lo utilizan para predecir los valores, a continuación, compare estos valores predichos de los verdaderos valores sentado en el set de prueba. Obviamente, las medidas de rendimiento tendría que ser diferente ya que esto no es una tarea de clasificación. La costumbre de residuos y la $R^2$ estadísticas son obvias medidas, pero hay más/mejores formas de evaluar el desempeño de los modelos de regresión? Parece que la clasificación tiene muchas opciones, pero la regresión es de izquierda a $R^2$ y de los residuos.