A pesar de que fue formado como ingeniero, me parece que me estoy convirtiendo en más interesados en la minería de datos. Ahora mismo estoy tratando de investigar el campo más. En particular, me gustaría entender las diferentes categorías de herramientas de software que existen y cuales son las herramientas notable en cada categoría y por qué. (Nótese que no dije "el mejor" de herramientas, sólo los notables para no iniciar una guerra llama.) Especialmente tome nota de las herramientas que son de código abierto y está disponible libremente - aunque no significa que sólo estoy interesado en código abierto y libre.
Respuestas
¿Demasiados anuncios?
DavLink
Puntos
101
Eche un vistazo a
- Weka (java, fuerte en la clasificación)
- Naranja (secuencias de comandos de python, en su mayoría clasificación)
- GNU R (R idioma, algo de la tabla de vectores orientados, ver la Máquina de Aprendizaje taskview, y el Traqueteo de interfaz de usuario)
- ELKI (java, fuerte en la agrupación y la detección de valores atípicos, el índice de estructura de soporte para la aceleración, el algoritmo de la lista)
- Mahout (Java, pertenece a Hadoop, si tiene un clúster y enormes conjuntos de datos)
y la UCI Machine Learning Repository para conjuntos de datos.
Eric Davis
Puntos
1542
Sonajero es una GUI de minería de datos que proporciona un front-end para los paquetes de una amplia gama de R.
Evan M.
Puntos
231
Desde la perspectiva de popularidad, este papel (2008) estudios superiores 10 algoritmos de minería de datos.