Qué algoritmos de aprendizaje automático se pueden escalar utilizando hadoop/map-reduce

Question

Qué algoritmos de aprendizaje automático se pueden escalar utilizando hadoop/map-reduce

Preguntado el 10 de Septiembre, 2013: Cuando se hizo la pregunta
1791 visitas: Cuantas visitas ha tenido la pregunta
4 Respuestas: Cuantas respuestas ha tenido la pregunta
Resuelta: Estado actual de la pregunta

Los algoritmos de aprendizaje automático escalables parecen estar de moda estos días. Todas las empresas están manejando nada menos que datos masivos . ¿Existe algún libro de texto en el que se hable de qué algoritmos de aprendizaje automático pueden escalarse utilizando arquitecturas paralelas como Map-Reduce, y qué algoritmos no? ¿O algunos artículos relevantes?

Preguntado el 10 de Septiembre, 2013 por OMiD

Answer 1

4 Respuestas

Answer 2

5voto

Jordan Puntos 26

Mahout in Action es un buen libro para leer sobre Mahout ( http://manning.com/owen/ ). Por supuesto, el sitio web tiene una visión general de los algoritmos cubiertos ( http://mahout.apache.org/ ).

Respondido el 10 de Septiembre, 2013 por Jordan (26 Puntos )

Answer 3

4voto

Chris Puntos 11

Vowpal Wabbit, un programa de aprendizaje automático muy rápido centrado en el aprendizaje por descenso de gradiente en línea, puede utilizarse con Hadoop: http://arxiv.org/abs/1110.4198 Aunque, nunca lo he usado de esta manera. Si lo entiendo correctamente, realmente sólo utiliza Hadoop para la fiabilidad y el suministro de los datos a los procesos Vowpal Wabbit. Utiliza algo como AllReduce de MPI para hacer la mayor parte de la comunicación.

Respondido el 11 de Septiembre, 2013 por Chris (11 Puntos )

Answer 4

4voto

IAmCodeMonkey Puntos 1217

Como señalan Jimmy Lin y Chris Dyer en el primer capítulo de su libro sobre Minería de textos con uso intensivo de datos con MapReduce A gran escala de datos, el rendimiento de los distintos algoritmos converge de tal manera que las diferencias de rendimiento prácticamente desaparecen. Esto significa que, dado un conjunto de datos lo suficientemente grande, el algoritmo que se quiere utilizar es el que es computacionalmente menos caro. Las diferencias de rendimiento entre los algoritmos sólo son importantes a escalas de datos más pequeñas.

Dicho esto, su libro (enlazado arriba) y Extracción de conjuntos de datos masivos de Anand Rajaraman, Jure Leskovec y Jeffrey D. Ullman son probablemente dos libros que también querrás consultar, especialmente porque están directamente relacionados con MapReduce para fines de minería de datos.

Respondido el 11 de Septiembre, 2013 por IAmCodeMonkey (1217 Puntos )

Answer 5

3voto

Carsten Thiel Puntos 751

Si tienes acceso a un clúster Hadoop, yo le daría un vistazo a Spark. https://spark.apache.org/

Respondido el 9 de Febrero, 2015 por Carsten Thiel (751 Puntos )

Qué algoritmos de aprendizaje automático se pueden escalar utilizando hadoop/map-reduce

Respuestas

Preguntas Destacadas

Etiquetas mas usadas

i-Ciencias.com

Powered by:

Qué algoritmos de aprendizaje automático se pueden escalar utilizando hadoop/map-reduce

Respuestas

Preguntas relacionadas

Preguntas Destacadas

Etiquetas mas usadas

En nuestra red

i-Ciencias.com

Powered by: