Me cuesta entender la aplicación de la regularización del lazo ( LassoCV sur sklearn ) y la selección de características. En primer lugar, utilicé la validación cruzada para determinar el valor de alfa que minimiza el MSE. En segundo lugar, utilizando este valor alfa, para determinar los coeficientes óptimos (utilizando modelo_lineal.ruta_lazo sur sklearn ) y el orden de los atributos para el despliegue. A partir de aquí el libro que estoy utilizando simplemente dice que "estos son los coeficientes a desplegar". De hecho, al buscar tutoriales similares en Internet, todos los ejemplos parecen detenerse en este punto, sin más explicaciones sobre el despliegue y la elaboración de predicciones. ¿Cómo debo emplear los coeficientes para hacer predicciones sobre subconjuntos de mis datos o sobre datos recién llegados?
Así que llamo:
regressor = LinearRegression(fit_intercept = False, normalize = True)
regressor.fit(X_train, y_train)
#substitute new coefficients
regressor.coef_ = np.array(lasso_coeffs)
y_pred = regressor.predict(X_test)
¿Es correcta esta forma de aplicación?
Pido disculpas por mi confusión al respecto, ya que tal vez no haya entendido bien lo que quería decir y agradecería una explicación.
Clive