Veo a muchas personas en la web suponiendo que R2 no es un métricas adecuadas para seleccionar un regresor en lugar de otro, lo que sugiere AIC o BIC para hacerlo. Desde mi punto de vista, esto significa que es casi preferible evitar modelos complejos, incluso si son más precisas (no estoy seguro de si esta visión es correcta).
Mi pregunta es, ¿qué está mal sobre el uso de MSE? Y a ver si el modelo es mejor que "siempre predicen la media", acaba de comprobar R2?
Otra razón por la que insisto en el uso de ellos para preferir un regresor en lugar de otro (incluso sin asegurarse de su conveniencia) es que sklearn
hace uso de R2 como predeterminado de la función de puntuación para GridSearchCV
.