Recientemente me he encontrado un documento en el que propone la utilización de una k-NN clasificador en un conjunto específico de datos. Los autores utilizaron todos los datos de las muestras para realizar la k-fold cross validation para diferentes k valores y el informe de validación cruzada de los resultados de las mejores hyperparameter de configuración.
A mi entender, este resultado es parcial, y que debería haber guardado por separado un conjunto de pruebas para obtener una precisión de la estimación de las muestras no se utiliza para realizar hyperparameter de optimización.
Estoy en lo cierto? Puede proporcionar algunas referencias (preferentemente trabajos de investigación) que describen este uso indebido de la validación cruzada?