Digamos que tengo un conjunto de datos que mezcla características categóricas y continuas y me gustaría estudiar la importancia relativa de cada característica en la predicción de una cierta clase.
Para eso estoy usando la regresión logística con una penalización de l1 porque quiero una solución dispersa que maximice el ROCAUC.
Antes de entrenar la regresión logística, primero creé variables ficticias para mis características categóricas y centré y escalé todas mis características, incluyendo las variables ficticias que he creado.
¿Puedo centrar y escalar las variables ficticias? Porque quiero comparar los coeficientes de la regresión logística entrenada en el conjunto de datos para clasificar las características.
¡Gracias por la ayuda!