36 votos

La validación cruzada mal uso (informes de rendimiento para el mejor hyperparameter valor)

Recientemente me he encontrado un documento en el que propone la utilización de una k-NN clasificador en un conjunto específico de datos. Los autores utilizaron todos los datos de las muestras para realizar la k-fold cross validation para diferentes k valores y el informe de validación cruzada de los resultados de las mejores hyperparameter de configuración.

A mi entender, este resultado es parcial, y que debería haber guardado por separado un conjunto de pruebas para obtener una precisión de la estimación de las muestras no se utiliza para realizar hyperparameter de optimización.

Estoy en lo cierto? Puede proporcionar algunas referencias (preferentemente trabajos de investigación) que describen este uso indebido de la validación cruzada?

34voto

Onur Yıldırım Puntos 5566

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X