Suponga que realiza un estudio de selección de parámetros en un entorno con no tantos puntos de datos. Divides los datos disponibles en un conjunto de entrenamiento y pruebas y planeas validar el futuro modelo en un conjunto de validación separado.
Haces todas tus heurísticas en el set de entrenamiento y cuando estás contento con los parámetros seleccionados, obtienes un modelo y lo pruebas en el set de pruebas. A veces, afinarás tu modelo, de acuerdo con los resultados del conjunto de pruebas, pero mantendrás estos afinamientos al mínimo.
Ahora está listo para publicar su modelo y validarlo usando un conjunto de datos externos de validación. ¿Reentrenaría el modelo (re-calibraría los parámetros) usando la combinación del entrenamiento y el conjunto de pruebas, o se ceñiría a lo que tiene?