Además de proc varclus
, randomForest
En lugar de utilizar métodos paso a paso para construir modelos de regresión logística binaria más parsimoniosos a partir de una amplia gama de posibles variables predictoras, estoy buscando otros métodos de selección de variables. He investigado otros métodos como Información mutua (MI), y tengo dos preguntas con respecto a su uso:
1) ¿Ha utilizado alguien el IM para la selección de variables de regresión logística binaria? En caso afirmativo, ¿qué opina de su aplicación?
2) ¿Alguien sabe cómo calcular el IM utilizando SAS Base o R para variables predictoras potenciales en referencia al resultado de interés? Cualquier ayuda o referencia en este ámbito será muy apreciada.
Gracias.