Si ya he encontrado la función de coste mínima en el subconjunto de validación, ¿por qué tendría que volver a probarla en el subconjunto de prueba?
Debido al error aleatorio: Normalmente sólo se tiene un número finito de casos.
La optimización del rendimiento de la validación (prueba interna) significa que se puede estar sobreajustando ese conjunto de pruebas internas. El conjunto de pruebas interno contribuye a la estimación del modelo final y, por tanto, no es independiente del modelo.
Esto significa que es necesario tener otro conjunto de pruebas (externo) que sea independiente de todo el procedimiento de modelado (incluyendo todos los procesos de optimización y preprocesamiento de datos o de selección de modelos) si se quiere estimar las propiedades de generalización.
Te recomiendo que hagas una simulación y compares las tres estimaciones de error que puedes tener
- resustitución: predicción del conjunto de trenes
medidas bondad de ajuste
- conjunto de pruebas internas (en su nomenclatura: validación): la calidad que el optimizador cree que se alcanza
- conjunto de pruebas externo: error de generalización, independiente del entrenamiento del modelo.
En una simulación se pueden comparar fácilmente también con un conjunto de pruebas adecuado, grande y generado de forma independiente. Si la configuración es correcta, la prueba externa debería ser insesgada (con respecto al modelo sustituto que evalúa, no con respecto a un modelo "final" construido sobre el conjunto de datos). La prueba interna suele tener un sesgo optimista, y la sustitución, un sesgo aún más optimista.
En mi campo, la prueba interna subestimaría fácilmente el error de generalización por un factor de 2 a 5 (mucho más para los esquemas de optimización agresivos).
Nota: la nomenclatura de los conjuntos no es universal. En mi campo (química analítica), la validación suele significar la prueba del rendimiento del procedimiento final, es decir, más lo que hace su conjunto de "prueba" que lo que hace su conjunto de "validación".
Por lo tanto, prefiero hablar de los conjuntos de pruebas interno y externo, o del conjunto de pruebas de optimización (= conjunto de pruebas interno) y entonces el conjunto de validación significaría el conjunto de pruebas externo.