Para usar SVM o Red Neural necesita transformar las variables categóricas en variables numéricas, el método normal en este caso es usar valores binarios 0-1 con el valor categórico k-ésimo transformado en (0,0,...,1,0,...0) (1 está en la posición k-ésimo). ¿Existen otros métodos para hacer esto, especialmente cuando hay un gran número de valores categóricos (por ejemplo, 10000) de tal manera que la representación 0-1 introducirá un gran número de dimensiones adicionales (unidades de entrada) en la red neuronal que no parece muy deseado o esperado?
Estoy preguntando sobre las estrategias generales.
0 votos
¿Preguntas por estrategias generales o por algún problema concreto?