16 votos

Estado-of-the-art ensemble algoritmo de aprendizaje en tareas de reconocimiento de patrones?

La estructura de esta pregunta es el siguiente: en primer lugar, que proporcionan el concepto de conjunto de aprendizaje, más que proporcionar una lista de reconocimiento de patrones de tareas, luego me doy ejemplos del conjunto de algoritmos de aprendizaje y, finalmente, presentar a mi pregunta. Aquellos que no necesitan toda la información complementaria podría mirar los titulares e ir directamente a mi pregunta.


¿Qué es el conjunto de aprendizaje?

Según la Wikipedia el artículo:

En las estadísticas y de aprendizaje de la máquina, el conjunto de métodos de uso múltiple algoritmos de aprendizaje para obtener una mejor predicción del rendimiento que podría ser obtenidos a partir de cualquiera de los componentes de los algoritmos de aprendizaje por sí solo. A diferencia de un conjunto de estadística en la mecánica estadística, que es generalmente infinito, una máquina de aprendizaje conjunto, se refiere a una hormigón conjunto finito de alternativas a los modelos, pero permite por lo general mucho estructura más flexible que existe entre esas alternativas.


Ejemplos de reconocimiento de patrones tareas:


Ejemplos del conjunto de algoritmos de aprendizaje:

El siguiente conjunto de algoritmos de aprendizaje utilizados para la PR tareas (según la Wiki):

Conjunto de algoritmos de aprendizaje (supervisado meta-algoritmos para la combinación de varios algoritmos de aprendizaje juntos):

  • Impulsar (una máquina de aprendizaje conjunto de meta-algoritmo para principalmente la reducción de sesgo, y también de la varianza en el aprendizaje supervisado, y una familia de algoritmos de aprendizaje automático que convertir débiles de los alumnos a los fuertes)

  • Bootstrap agregación ("embolsado") (una máquina de aprendizaje conjunto de meta-algoritmo diseñado para mejorar la estabilidad y la precisión de los algoritmos de aprendizaje automático se utiliza en estadística de clasificación y regresión).

  • Un promedio de conjunto (el proceso de creación de varios modelos y las combina para producir una salida deseada, como contraposición a la creación de un único modelo. Con frecuencia un conjunto de modelos se comporta mejor que cualquier modelo individual, debido a los diversos errores de los modelos de "promedio".)

  • La mezcla de expertos, jerárquica mezcla de expertos

Implementaciones diferentes

  • Conjuntos de redes neuronales (un conjunto de modelos de red neuronal de tomar una decisión por el promedio de los resultados de los modelos individuales).
  • Bosque aleatorio (un conjunto de aprendizaje método de clasificación, regresión y otras tareas, que operan mediante la construcción de una multitud de árboles de decisión en el tiempo de entrenamiento y la salida de la clase que se la modalidad de las clases (clasificación) o la media de la predicción (regresión) de los árboles individuales).
  • AdaBoost (la salida de los otros algoritmos de aprendizaje ('débil estudiantes') se combinan en una suma ponderada que representa el final salida de la impulsó clasificador).

Además:

  • Los métodos que utiliza una red neuronal para combinar diferentes clasificadores
  • Áreas de competencia método

Mi pregunta

Que el conjunto de algoritmos de aprendizaje se considera estado-de-el-arte en la actualidad y se utiliza realmente en la práctica (para la detección de la cara, registro del vehículo, placas de reconocimiento, reconocimiento óptico de caracteres, etc.) por parte de las empresas y organizaciones? El uso conjunto de algoritmos de aprendizaje se supone que es para aumentar la precisión del reconocimiento y conducir a una mejor eficiencia computacional. Pero, ¿ están las cosas de esta manera en la realidad?

Que conjunto de método, potencialmente, puede mostrar una mejor precisión de la clasificación y el rendimiento en las tareas de reconocimiento de patrones? Tal vez, algunos de los métodos son anticuados, o han demostrado ser ineficaces. También es posible que el conjunto de los métodos de ahora tienden a no ser utilizado nunca más en la fuerza de algunos de los nuevos algoritmos. Los que tienen experiencia en el área o que tenga los suficientes conocimientos en este campo, puede ayudar a aclarar el asunto?

10voto

Franck Dernoncourt Puntos 2128

Estado-de-la-arte de los algoritmos pueden diferir de lo que se utiliza en la producción en la industria. También, el último puede invertir en la afinación más básica (y a menudo más interpretables) enfoques para que se vean mejor de lo que los profesores.

Ejemplo 1: de Acuerdo a TechCrunch, el Matiz se inicio el uso de "aprendizaje profundo tech" en su Dragón de reconocimiento de voz de los productos de este mes de septiembre.

Ejemplo 2: Chiticariu, Laura, Yunyao Li, y Frederick R. Reiss. "La regla Basada en la Extracción de Información está Muerto! Larga Vida A La Regla Basada En La Extracción De Información De Los Sistemas!." En EMNLP, no. Octubre, pp 827-832. 2013. https://scholar.google.com/scholar?cluster=12856773132046965379&hl=en&as_sdt=0,22 ; http://www.aclweb.org/website/old_anthology/D/D13/D13-1079.pdf

enter image description here

Con eso se dice:

Que el conjunto de algoritmos de aprendizaje se considera estado-de-el-arte en la actualidad

Uno de los estado-de-la-arte de los sistemas para la clasificación de la imagen se presenta alguna buena ganancia con el ensemble (al igual que la mayoría de los otros sistemas que yo sepa): Él, Kaiming, Xiangyu Zhang, Shaoqing Ren, y Jian Sol. "De profundidad residual de aprendizaje para el reconocimiento de imagen." arXiv preprint arXiv:1512.03385 (2015). https://scholar.google.com/scholar?cluster=17704431389020559554&hl=en&as_sdt=0,22 ; https://arxiv.org/pdf/1512.03385v1.pdf

enter image description here

2voto

etechpartner Puntos 188

Hay mucho de qué pasaría si los involucrados con su pregunta, y por lo general encontrar el mejor modelo que implica la evaluación de la mayoría de estos en los datos. Sólo porque un modelo en teoría podría producir resultados más precisos, no significa que siempre va a producir un modelo con menor error.

Lo que se dice... La Red neuronal de los conjuntos puede ser muy precisa, como usted puede aceptar el cuadro negro. Variando el número de nodos y el número de capas puede cubrir una gran cantidad de variación en los datos, con la introducción de este muchos modelización de los factores podría ser fácil overfit los datos.

Bosques aleatorios rara vez han producido los resultados más precisos, pero impulsado árboles modelo de relaciones complejas, como en la IA de las tareas que se discute sin mucho riesgo de sobreajuste.

Uno podría pensar, bueno, por qué no acaba de conjunto de todos estos modelos juntos, pero este modelo de concesiones sobre las posibles fortalezas de los modelos individuales. De nuevo, esto podría llevar a algunos problemas de sobreajuste.

Los modelos que son computacionalmente eficiente es un asunto diferente, y no me gustaría empezar con una muy complicada red neuronal. El uso de una red neuronal como un punto de referencia, en mi experiencia ha sido más eficiente el uso impulsado árboles.

Esto se basa en mi experiencia, y una comprensión razonable de la teoría subyacente a cada una de la modelización de los tipos de discutido.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X