¿Cómo calculo qué modelo de red elástica es el más regularizado/parsimonioso?
Estoy recreando GLMnet en otro idioma como ejercicio. Quiero hacer una búsqueda cuadriculada sobre varios valores de alfa y lambda, y luego tomar el modelo más parsimonioso con un error de predicción dentro de 1 error estándar de la media del error de predicción más pequeño. (Creo que esto es similar a lo que hace el paquete caret de R).
Mi pregunta es: ¿cómo elijo "más parsimonioso"? Un lambda más alto significa una regularización más fuerte, al igual que un alfa más alto, pero ¿cómo combino los dos?