Tengo el siguiente problema de regresión
Tengo alrededor de 60 variables independientes; algunos de ellos tienen una alta correlación con los demás. Tengo alrededor de 3 millones de observaciones
(1) - Mi objetivo principal es fuera de la muestra de predicción, por lo que mi principal pregunta es: ¿qué método de regularización se debe utilizar en este caso?
Más preguntas a los (supuestos que tengo, probablemente un poco confundido)
(2) - regresión Ridge, aunque no completamente, la eliminación de los coeficientes de mantener los coeficientes bajos que el lazo elástico/net/BIC sería eliminar completamente, ¿es correcto? (Si no, sería un problema?)
(3) - Si yo quería usar AIC/BIC en este caso, tendría que probar todas las combinaciones posibles de los 60 independiente de las variables?
(4) - Tendría sentido empezar con el AIC/BIC, luego de hacer la regresión contraída con el resto de las variables independientes? (Supongo que cresta de regresión después de la AIC/BIC podría tener sentido debido a que algunas de las variables independientes se correlacionan con los demás?)
Gracias