Quiero aplicar el aprendizaje automático y el aprendizaje profundo.
Tengo datos categóricos sobre la cadena. Mi primera opción era realizar una codificación ficticia en las columnas ( scikitlearn
). Pero hay algunas columnas que tienen miles de valores categóricos, si utilizo la codificación ficticia, esto ampliará enormemente el conjunto de datos.
¿Qué otra alternativa tengo? ¿Si simplemente realizo un codificador de etiquetas y luego escalo todo entre 0 y 1 podría funcionar?