5 votos

Ejecución de regresiones logísticas regularizadas en conjuntos de datos muy grandes

Quiero ejecutar una regresión logística regularizada en un conjunto de datos con 25 millones de observaciones y unas 1000 columnas mayoritariamente no dispersas con pesos no ignorables.

Mi primera opción sería el BayesGLM, pero estoy seguro de que no es ni remotamente cercano a la viabilidad computacional. Estuve mirando las implementaciones de LASSO/ElasticNet en SciPi y no parece tener la capacidad de tomar datos ponderados. ¿Alguien tiene alguna recomendación?

3voto

luison Puntos 176

La última versión de Liblinear puede manejar este problema fácilmente. puedes buscar liblinear a través de Google.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X