Una de las motivaciones de la red elástica fue la siguiente limitación de LASSO:
En el $p > n$ el lazo selecciona como máximo n variables satura, debido a la naturaleza del problema de optimización convexo. Esto parece ser una característica limitante para un método de selección de variables. Además, el lazo no está bien definido a menos que el límite de la L1 de los coeficientes sea inferior a un valor determinado.
( http://onlinelibrary.wiley.com/doi/10.1111/j.1467-9868.2005.00503.x/full )
Tengo entendido que LASSO es un problema de programación cuadrática, pero que también puede resolverse mediante LARS o descenso de gradiente por elementos. Pero no entiendo donde en estos algoritmos me encuentro con un problema si $p > n$ donde $p$ es el número de predictores y $n$ es el tamaño de la muestra. ¿Y por qué este problema se resuelve utilizando red elástica donde aumento el problema a $p+n$ variables que supera claramente $p$ .