¿Cómo se utilizan las variables categóricas al ajustar un árbol de decisión en scikit-learn?

Question

¿Cómo se utilizan las variables categóricas al ajustar un árbol de decisión en scikit-learn?

Preguntado el 28 de Marzo, 2013: Cuando se hizo la pregunta
3456 visitas: Cuantas visitas ha tenido la pregunta
1 Respuestas: Cuantas respuestas ha tenido la pregunta
Abierta: Estado actual de la pregunta

Estoy acostumbrado a R, en el que se puede utilizar factor(variable) para indicar una variable categórica. Sin embargo, en scikit-learn, intentar pasar una variable de cadenas hace que el DecisionTreeClassifier dé un error.

¿Cómo se supone que se utiliza una variable categórica en scikit-learn? ¿La única opción para codificar una variable multiclase es utilizar variables ficticias?

Preguntado el 28 de Marzo, 2013 por Andrew Brown

Answer 1

1 Respuestas

Answer 2

3voto

On Freund Puntos 3479

Para codificar una característica categórica como una matriz scipy.sparse se puede utilizar la función DictVectorizer clase. A continuación, llame a la .toarray() en el resultado para convertirlo en un array numpy contiguo, ya que los árboles de scikit-learn no soportan todavía la entrada dispersa.

Respondido el 5 de Abril, 2013 por On Freund (3479 Puntos )

¿Cómo se utilizan las variables categóricas al ajustar un árbol de decisión en scikit-learn?

Respuesta

Preguntas Destacadas

Etiquetas mas usadas

i-Ciencias.com

Powered by:

¿Cómo se utilizan las variables categóricas al ajustar un árbol de decisión en scikit-learn?

Respuesta

Preguntas relacionadas

Preguntas Destacadas

Etiquetas mas usadas

En nuestra red

i-Ciencias.com

Powered by: