Estoy tratando de validar si mi comprensión del tema es correcta.
Los modelos lineales recogen una única representación de una clase (léase sólo pueden elegir una) mientras que un modelo no lineal como una red neuronal es capaz de aprender múltiples representaciones de cada clase.
En ese caso, los modelos lineales no son menos eficaces que sus homólogos, aunque los tiempos de cálculo del modelo serán mucho más lentos.
PD: Me he referido al material de Stanford cs231n para llegar a esta conclusión.