13 votos

¿Qué lenguaje de programación qué le recomendaría a un prototipo de la máquina problema de aprendizaje?

Actualmente trabaja en la Octava, pero debido a la pobre documentación de progreso es muy lento.

Qué idioma es fácil de aprender y usar, y está bien documentado para resolver la máquina de problemas de aprendizaje? Estoy buscando prototipo en un pequeño conjunto de datos (miles de ejemplos), por lo que la velocidad no es importante.

EDIT: estoy desarrollando un motor de recomendación. Así que, estoy interesado en el uso de Regularización de la Regresión Lineal, Redes Neuronales, SVN o el Filtrado Colaborativo.

15voto

goldPseudo Puntos 682

Usted puede obtener las mejores respuestas si especifica los algoritmos específicos que usted está interesado en. Puedo usar R para este tipo de cosas (yo lo hago de la econometría de series de tiempo, sin embargo, no de aprendizaje de la máquina); se puede ver la funcionalidad existente aquí:

http://cran.r-project.org/web/views/MachineLearning.html

y no es R código para implementar el análisis en Hastie, Tibshirani y Friedman Elementos de aprendizaje estadístico:

http://www-stat.stanford.edu/~tibs/ElemStatLearn/

R sistema de paquetes es bastante grande y codazos a la gente hacia la documentación de su código, y es de código abierto, por lo que siempre puede ir a buscar a la aplicación. No he utilizado Matlab en un par de años y no lo uso mucho para la máquina de aprendizaje, sus cajas de herramientas son generalmente bien documentado, pero puede ser caro, pero el usuario contribuido con código va a estar tan mal documentado como cualquier otro.

11voto

YequalsX Puntos 320

En su máquina de aprendizaje de cursos en línea, Andrew Ng sugiere el uso de Octave/Matlab.

Te recomiendo que inscribirse en la próxima edición de este curso: es realmente útil y aprenderás muchas cosas acerca de la Octava y acerca de los diferentes algoritmos de aprendizaje automático.

EDIT 1: estoy de acuerdo con otras personas que prefieren trabajar en R. sin Embargo, en la solución de los problemas de aprendizaje de la máquina, la mayoría de los cálculos, será en la forma de la matriz, y como se ha señalado por @Wayne, Matlab u Octave idiomas son muy populares debido a su poder. Puede que desee echar un vistazo a las soluciones para la máquina de aprendizaje de los ejercicios propuestos por otros estudiantes; sin duda, usted puede aprender algunas cosas de ellos:

Gkokaisel Github

De Merwan Github

10voto

DavLink Puntos 101

El scikit-learn (ahora sklearn) debe cumplir con varios de los criterios que se describen (velocidad, bien diseñados clases para el manejo de los datos, modelos y resultados), incluyendo aplicaciones específicas (L1/L2 penalizado de regresión, SVM, etc.). Viene con un rico conjunto de documentación y un montón de ejemplos. Véase también su descripción en un papel publicado en la JMLR.

Un marco alternativo en Python es de color Naranja, que puede ser utilizado a través de un suave interfaz gráfica de usuario o en la línea de comandos directamente. Para el filtrado colaborativo, pyrsvd podría ser interesante, pero yo nunca lo he probado. Sin embargo, Apache Mahout , ciertamente, puede ser utilizado para el filtrado colaborativo.

7voto

araroot Puntos 96

Si desea utilizar algo fuera de la caja, Weka podría ser un gran punto de partida. No hay necesidad de programar nada. Importar sus datos, visualizar y jugar con diferentes modelos.

El siguiente en la cadena sería R. Hay una cierta curva de aprendizaje asociada - especialmente con sobrecargar sus datos para que se ajuste a R estructuras de datos, pero una vez superado eso, usted tiene toneladas de bibliotecas que ofrecen toda la máquina de la capacidad de aprendizaje sin mucho esfuerzo.

El siguiente sería de la mano de programación de los algoritmos de aprendizaje automático. Puesto que usted ya está utilizando la Octava y la búsqueda de alternativas, tal vez lo que desea no está a la mano el código de los algoritmos en algún otro sistema, sino simplemente para utilizar las bibliotecas escritos por otras personas.

Si vas por la I ruta de acceso, usted podría encontrar en el libro de Luis Torgo (Minería de Datos con R: Aprendizaje con Estudios de Caso) muy útil (divulgación: ninguna afiliación). Se describe en profundidad los estudios de caso que usted puede adaptar a su problema.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X