Estoy haciendo una regresión múltiple en uno de mis proyectos. La matriz de diseño de entrada $X$ tiene columnas correlacionadas. Sin embargo, hay algunos "buenos" predictores en $X$ si ajusto sólo los buenos predictores, uno por uno, haciendo OLS, puedo ver un buen resultado de predicción para cada uno de ellos.
Sin embargo, cuando reúno las 20 columnas en LASSO, la predicción en Out-of-Sample se vuelve muy mala.
Mi sospecha es que LASSO no puede manejar la multicolinealidad de $X$
En este caso, ¿qué es lo mejor que se puede probar?
¿Alguna idea?