He tomado una máquina de aprendizaje del curso en mi universidad. En uno de los participes, esta pregunta se la hicieron.
Modelo 1 : $$ y = \theta x + \epsilon $$ Modelo 2 : $$ y = \theta x + \theta^2 x + \epsilon $$
Cual de los anteriores modelos de ajuste de datos mejor? (suponga que los datos pueden ser modelados mediante regresión lineal)
La respuesta correcta (de acuerdo con el profesor), es que ambos modelos funcionan igualmente bien. Sin embargo, creo que el primer modelo sería un mejor ajuste.
Esta es la razón detrás de mi respuesta. El segundo modelo, que puede escribirse como $ \alpha x + \epsilon $, $\alpha = \theta + \theta^2$ no sería el mismo que el primer modelo. $\alpha$ es de hecho una parábola, y por lo tanto tiene un valor mínimo ($ -0.25 $ en este caso). Ahora bien, debido a esto, el rango de $ \theta $ en el primer modelo, es mayor que el rango de $ \alpha $ en el segundo modelo. Por lo tanto, si los datos fue tal, que el mejor ajuste tenía una inclinación de menos de $-0.25$, el segundo modelo que iba a realizar muy mal como en comparación con la primera. Sin embargo, en el caso de que la pendiente de el mejor ajuste fue mayor que $-0.25$, ambos modelos funcionan igualmente bien.
Así es que la primera mejor, o ambos sean el mismo?