Sé que en la práctica no se prefieren los polinomios superiores a los cúbicos para representar curvas. ¿Cuáles son las razones para ello? ¿Es sólo porque la resolución del problema inverso de encontrar $x$ valor dado de $P(x)$ es difícil para los polinomios de mayor grado?
Respuesta
¿Demasiados anuncios?Sabemos que un grado $n$ polinomio se puede utilizar para interpolar $n+1$ apunta perfectamente.
Sin embargo, un polinomio de alto grado tiende a fluctuar mucho y, en el contexto de la regresión, podríamos estar aprendiendo sólo el ruido en lugar del comportamiento subyacente del patrón de datos de interés. A este comportamiento lo llamamos sobreajuste.
Sin embargo, no está claro que el grado $3$ es la respuesta por defecto, de hecho, no debería existir tal respuesta. Depende mucho de los datos. Si utilizamos un grado muy alto, estamos abocados al sobreajuste, si utilizamos un modelo demasiado simple, estamos abocados al infraajuste.
El fenómeno de Runge también puede ser de su interés.