En este caso, los datos $x$ se generan aleatoriamente, y $t$ se generan ejecutando $x$ a través de una función $\sin(2\pi x)$ y, a continuación, se añade ruido gaussiano.
A continuación, el texto de Bishop intenta ajustar esos datos mediante un polinomio de 9º grado, es decir, $y(x,w) = w_o + w_1 x + \ldots + w_Mx^M$ (Se muestra en la figura)
Luego demostraron que esto da lugar a un gran error cuadrático medio para los datos de prueba.
Y la razón es que los pesos asociados a cada uno de los parámetros es extremadamente grande, algo así como $w_i = O(1000000)$
Pero, ¿se trata de una casualidad?
¿Por qué tiene que ser tan grande el peso del polinomio?
Un polinomio de 9º orden debe tener 8 protuberancias.
Eso es todo lo que necesita. Así que la curva de Bishop podría simplemente parecerse a la curva negra que he dibujado.
Se acabaron los pesos enormes, problema resuelto.
¿Puede alguien comentar por qué los pesos asociados al polinomio deben ser tan grandes cuando ajusto un polinomio de orden alto, en lugar de tener pesos más pequeños como la curva que he dibujado?
¿Se trata simplemente de un error de simulación en el texto de Bishop, o la resolución del problema de optimización da realmente un peso tan grande (cosa que no creo)?
Añadido: Pesos exactos como se muestra en el libro de texto.
Experimento: Poly-fitting en R utilizando los mismos datos