14 votos

Selección de variables en el modelo de regresión logística

Estoy trabajando en un modelo de regresión logística, tengo 417 variables independientes para probar, pero ejecutar un modelo con todas ellas es demasiado (para Rstudio), ¿cuál sería un buen criterio para descartar algunas variables de antemano?

¡Gracias por sus respuestas! El objetivo de este trabajo es desarrollar un modelo predictivo para detectar qué clientes son más propensos a convertirse en cuentas incobrablees en una empresa de servicios públicos.

4voto

Alex Puntos 128

Justificación teórica más allá de todo lo demás. Aparte de eso, LASSO o métodos sancionados similares serían mi próxima sugerencia.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X