Supongamos que he entrenado varios modelos en el conjunto de entrenamiento, elegir el mejor uno mediante validación cruzada para establecer y medir el desempeño en la prueba de conjunto. Así que ahora tengo un final mejor modelo. Debo entrenar de nuevo en mi todos los datos disponibles o de la nave de solución formado sólo en el conjunto de entrenamiento? Si es esto último, entonces, ¿por qué?
ACTUALIZACIÓN: Como @P. Windridge señaló el envío de un recapacitar modelo básicamente significa que el envío de un modelo sin validación. Pero podemos informe conjunto de pruebas de rendimiento y después de que reeducar el modelo de datos completo con rectitud esperando que el rendimiento sea mejor, porque hacemos nuestro mejor modelo, además de ser más datos. ¿Qué problemas pueden surgir a partir de esa metodología?
P. S. Mi pregunta es hipotética, lo que significa que no tienen tal problema ahora, me pregunto.