Con todos los medios hablaran y hype acerca de profundo aprendizaje estos días, he leído algunas cosas elementales sobre él. Acabo de encontrar que es un máquina de aprendizaje método para aprender patrones de datos. ¿Pero mi pregunta es: que hace y por qué este método brillar? ¿Por qué todos el hablar de él ahora mismo? Es decir, ¿qué es todo el alboroto?
Respuestas
¿Demasiados anuncios?Los principales supuestos beneficios:
(1) no necesita de la mano del ingeniero de características no lineales en problemas de aprendizaje (ahorrar tiempo y escalable para el futuro, ya que de la mano de la ingeniería es visto por algunos como una de corto plazo (band-aid)
(2) El aprendido características son a veces mejor que la mejor mano de ingeniería de características, y puede ser tan complejo (de visión de computadora - por ejemplo, la cara de características similares) que tomaría demasiado tiempo humano para el ingeniero.
(3) se Puede utilizar la etiqueta de datos para pre-tren de la red. Supongamos que tenemos 1000000 unlabaled imágenes y 1000 imágenes marcadas. Ahora podemos mejorar drásticamente de un algoritmo de aprendizaje supervisado por la pre-formación sobre la 1000000 unlabaled imágenes con el aprendizaje profundo. Además, en algunos de los dominios que tenemos mucho unlabaled de datos, pero etiquetados de datos es difícil de encontrar. Un algoritmo que puede usar este unlabaled datos para mejorar la clasificación es valioso.
(4) Empíricamente, destruyeron muchos de los criterios que fueron sólo de ver las mejoras incrementales hasta la introducción de la profundidad de los métodos de aprendizaje.
(5)el Mismo algoritmo funciona en múltiples áreas con raw (tal vez con menor pre-procesamiento de las entradas.
(6) sigue mejorando a medida que más datos se alimenta a la red (suponiendo distribuciones estacionarias etc).
Otro punto importante además lo anterior (no tiene suficiente rep agregarlo simplemente como un comentario) es que es un modelo generativo (redes de creencia profunda por lo menos) y así se puede degustar de las distribuciones de doctas - esto puede tener algunos beneficios importantes en ciertas aplicaciones donde desea generar datos sintéticos correspondientes a las clases/los racimos aprendidos.