En varias publicaciones he visto que se afirman ambas cosas y ahora no sé cuál de las dos es cierta.
El que dice lineal en términos de pesos afirma que uno puede simplemente añadir términos de orden superior para las entradas y seguir aprendiendo modelos no lineales mientras que el problema de optimización sigue siendo lineal en términos de pesos.
Hay otros que afirman que es lineal en términos de entradas.
¿Alguien puede aclararlo?
Esto es lo que se dice en Elements of Statistical Learning :