Intro:
Tengo un conjunto de datos con un problema clásico de "p grande, n pequeño". El número de muestras disponibles n \=150 mientras que el número de posibles predictores p \=400. El resultado es una variable continua.
Quiero encontrar los descriptores más "importantes", es decir, los que son mejores candidatos para explicar el resultado y ayudar a construir una teoría.
Tras investigar sobre este tema, descubrí que LASSO y Elastic Net se utilizan habitualmente para el caso de p grande, n pequeño. Algunos de mis predictores están muy correlacionados y quiero conservar sus agrupaciones en la evaluación de importancia, por lo que opté por Red elástica . Supongo que puedo utilizar los valores absolutos de los coeficientes de regresión como medida de importancia (por favor, corríjanme si me equivoco; mi conjunto de datos está normalizado).
Problema:
Como mi número de muestras es pequeño, ¿cómo puedo conseguir un modelo estable?
Mi enfoque actual consiste en encontrar los mejores parámetros de ajuste (lambda y alfa) en una búsqueda de cuadrícula en el 90% del conjunto de datos con una validación cruzada de 10 veces promediando la puntuación MSE. A continuación, entreno el modelo con los mejores parámetros de ajuste en el 90% del conjunto de datos. Soy capaz de evaluar mi modelo utilizando R al cuadrado en el 10% del conjunto de datos (que representa sólo 15 muestras).
Ejecutando repetidamente este procedimiento, encontré una gran varianza en las evaluaciones de R al cuadrado. Además, el número de predictores distintos de cero varía, así como sus coeficientes.
¿Cómo puedo conseguir una evaluación más estable de la importancia de los predictores y una evaluación más estable del rendimiento final del modelo?
¿Puedo ejecutar repetidamente mi procedimiento para crear varios modelos y luego promediar los coeficientes de regresión? ¿O debo utilizar el número de apariciones de un predictor en los modelos como su puntuación de importancia?
Actualmente, obtengo alrededor de 40-50 predictores no nulos. ¿Debería penalizar más el número de predictores para mejorar la estabilidad?