Me he encontrado con un rumor de que algunos estudios mostraron que el rendimiento de los modelos de predicción depende más de la experiencia del analista de datos con el método elegido que en la elección del método.
En otras palabras, el argumento es que es más importante que el analista de datos está familiarizado con el método elegido de cómo "apropiado" el método podría parecer para el problema desde un punto de vista teórico.
Esto fue mencionado en el contexto de la quimiometría, lo que implica normalmente los problemas de muchas variables (100s - 1000), múltiples colinealidad, y por supuesto, muy pocas muestras. La predicción puede haber sido la clasificación o regresión.
Mi experiencia personal sugiere que esto es plausible, pero un estudio que se menciona (le pregunté a la persona que mencionó que por correo electrónico después de un rápido pero infructuosa búsqueda, pero nunca recibí una respuesta). Sin embargo, también con una más elaborada de búsqueda, yo no era capaz de seguir la pista de cualquier papeles.
Es alguien consciente de tales resultados? Si no, ¿qué hace la experiencia personal de los Grandes Chicos de aquí a decir?