Me encontré con una pregunta sencilla sobre la comparación de modelos flexibles (por ejemplo, splines) frente a modelos inflexibles (por ejemplo, regresión lineal) en diferentes escenarios. La pregunta es:
En general, ¿esperamos que el rendimiento de un método de aprendizaje estadístico flexible sea mejor o peor que el de un método inflexible cuando:
- El número de predictores $p$ es extremadamente grande, y el número de observaciones $n$ es pequeño?
- La varianza de los términos de error, es decir $^2 = \text{Var}(e)$ ¿es extremadamente alta?
Creo que para (1), cuando $n$ es pequeño, los modelos inflexibles son mejores (no estoy seguro). Para (2), no sé qué modelo es (relativamente) mejor.
0 votos
El error de generalización no es ni mucho menos trivial. Por desgracia, las reglas generales no ayudan mucho en este sentido.
8 votos
Parece que esto es de James, Witten, Hastie, Tibshirani's Introduction to Statistical Learning
1 votos
1. Un método flexible se ajustaría en exceso al reducido número de observaciones. 2. Un método flexible se ajusta al ruido en los términos de error y aumenta la varianza.