He escuchado la siguiente expresión anterior:
"La optimización es la raíz de todos los males en las estadísticas".
Por ejemplo, la respuesta en este hilo hace que la declaración en referencia al peligro de la optimización de una manera demasiado agresiva durante la selección del modelo.
Mi primera pregunta es la siguiente: Es esta cita atribuible a alguien en particular? (por ejemplo, en las estadísticas de la literatura)
Por lo que entiendo, la declaración se refiere a los riesgos de sobreajuste. La sabiduría tradicional diría que una correcta validación cruzada ya la lucha contra este problema, pero parece que hay más a este problema que eso.
Debe estadísticos & ML de los profesionales recelan de la sobre-optimización de sus modelos, incluso cuando se respeta la cruz de validación de protocolos (por ejemplo, 100 anidada 10 veces CV) ? Si es así, ¿cómo podemos saber cuándo detener la búsqueda para "el mejor" modelo?