Quiero ejecutar una regresión logística regularizada en un conjunto de datos con 25 millones de observaciones y unas 1000 columnas mayoritariamente no dispersas con pesos no ignorables.
Mi primera opción sería el BayesGLM, pero estoy seguro de que no es ni remotamente cercano a la viabilidad computacional. Estuve mirando las implementaciones de LASSO/ElasticNet en SciPi y no parece tener la capacidad de tomar datos ponderados. ¿Alguien tiene alguna recomendación?