Hein,
hay un montón de herramientas y librerías con la funcionalidad disponible.
La elección depende de si desea utilizar un gui para su trabajo o si desea incrustarlo en algún otro programa.
Herramientas autónomas de minería de datos (hay otras como WEKA con interfaz Java):
- Rapid Miner
- Naranja
- Rattle gui para R
- KNIME
Basado en el texto:
Libres:
- Scikit para Python
- Mahout en Hadoop
Si conoces un lenguaje de programación lo suficientemente bien, yo usaría una librería para ese lenguaje o daría una oportunidad a R. Si no, puedes probar una de las herramientas con gui.
Un ejemplo de árbol en R:
# we are using the iris dataset
data(iris)
# for our tree based model we use the rpart package
# to download it type install.packages("rpart")
library(rpart)
# Building the tree
fit <- rpart(Species ~ Petal.Length + Petal.Width, method="class", data=iris)
# Plot the tree
plot(fit)
text(fit)
Como se ha sugerido, el análisis con R requiere que usted mismo codifique, pero encontrará un paquete para la mayoría de las tareas de clasificación que funcionará de forma inmediata. Se puede encontrar una visión general aquí Vista de tareas de aprendizaje automático
Para empezar a utilizar RapidMinder debería echar un vistazo a Youtube. Hay algunos screencasts, incluso para los árboles de decisión.