27 votos

Cómo lidiar con un SVM con atributos categóricos

Tengo un espacio de 35 dimensiones (atributos). Mi problema analítico es una clasificación simple.

De los 35 dimensiones, más de 25 son categóricos y cada atributo que lleva más de 50 tipos de valores.

En ese escenario, la introducción de una variable ficticia también no va a funcionar para mí.

¿Cómo puedo ejecutar una SVM en un espacio que tiene un montón de atributos categóricos?

27voto

Rhythmic Fistman Puntos 7612
  1. Si está seguro de la categoría de atributo en realidad es ordinal, entonces sólo lo tratan como atributo numérico.
  2. Si no, utilice algunos de codificación truco para convertirlo en atributo numérico. De acuerdo a la propuesta por el autor de libsvm, se puede simplemente usar 1-de-K de codificación. Por ejemplo, supongamos que un 1-dimensional categoría atributo toma el valor de $\{A,B,C\}$. Sólo a su vez en 3 dimensiones los números de tal manera que $A = (1,0,0)$, $B = (0,1,0)$, $C = (0,0,1)$. Por supuesto, esto supone significativamente dimensiones adicionales en su problema, pero creo que no es un problema serio para los modernos SVM solver (no importa Lineal tipo o el Kernel tipo de adoptar).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X