El trabajo en redes neuronales, ciertamente, perdió el favor siguientes a la publicación de Minsky y Papert en 1966-67. Sólo he desnatada porciones de la sociología de papel que se hace referencia en la pregunta, pero otras circunstancias sugieren que el tema podría haber disminuido en popularidad incluso sin sus resultados.
Rosenblatt del perceptrones ciertamente había creado un montón de entusiasmo,
tal vez la primera gran ola de entusiasmo acerca de la IA (que más tarde fue seguido por
la década de 1980 entusiasmo acerca de la regla basada en la "sistemas expertos" y la
corriente de excitación sobre neural net y otros de la máquina de aprendizaje
técnicas). Una historia involucra a un informe de la conferencia sobre la
el desarrollo de un tipo perceptrón que podría detectar con precisión la presencia
de tanques del ejército en las fotografías de los campos y los bosques: los insumos que intervienen la digitalización de cada fotografía en 16 píxeles.
Gran parte del entusiasmo alrededor de perceptrones devengados a la convergencia de los teoremas de garantizar que si un tipo perceptrón podría decidir alguna cuestión, el aprendizaje básico
procedimientos de converger en una adecuada red pesos. Estos teoremas todos los que juegan fuera de la lineal umbral para perceptrones. Me imagino que muchos de tipo perceptrón
publicaciones ascendieron a un recuento de algunos de resultado estándar acerca de
transformaciones lineales en la configuración de tipo perceptrón.
Entonces, Minsky y Papert importante papel dirigido a matemáticos apareció, con el título de "Linealmente irreconocible patrones". Este título es a la vez preciso y engañoso en su propio derecho.
El título es exacta debido a que el principal resultado fue que algunos modelos no son reconocibles por lineal umbral de máquinas. Pero obviamente, este resultado por sí solo no condena las redes neuronales. Si transformaciones lineales no son adecuados para caracterizar algunos de los patrones de interés, cómo sobre polinomios? Trigonométricas y funciones exponenciales? No hubo falta de alternativas disponibles para el estudio.
El título es engañoso en que
no hace ninguna mención de Minsky y Papert segundo principal resultado, que incluso
al considerar sólo linealmente-patrones reconocibles, los sabios de
pesos requeriría astronómicamente tamaño de precisión, y por lo tanto
cantidades astronómicas de datos para determinar estos pesos.
Así que la red neuronal investigadores se enfrentaron a dos problemas:
Las computadoras eran ridículamente pequeñas en comparación con las máquinas de hoy en día, y el
cantidad de datos que se podía obtener era muy pequeño en comparación con la gran
las cantidades disponibles hoy en día. Durante décadas, la falta de datos suficientes, y
de máquinas capaces de manipular estos datos, impidió que muchas partes de
AI, simbólico y nonsymbolic.
También, la red neuronal métodos no eran explicables. Minsky y otros defendido heurística y simbólico métodos, cuyas respuestas y acciones pueden ser
explicado en términos que significan algo para la gente. En contraste, de los nervios
funcionan las redes sociales como cajas negras, sistemas capacitados para proporcionar un
la respuesta, pero incapaz de ofrecer ninguna explicación significativa a
personas. Esta limitación persiste hasta el día de hoy. Durante décadas, es
proporciona un fácil réplica a la neural net proponentes, en muchos campos
tales como el diagnóstico médico, nadie lo va a seguir las recomendaciones de la máquina
sin explicaciones razonables.
Las circunstancias han cambiado desde entonces. Hinton y otros persistieron en el desarrollo de técnicas para redes multicapa, la investigación de ideas basadas en métodos no lineales de la física clásica. La velocidad de procesamiento y la disponibilidad de datos han aumentado. También los recientes soluciones de problemas interesantes, tales como la no-trivial, Vaya, han dado mucho de una razón para considerar el uso de redes neuronales, incluso sin explicability.
Así que me parece que el
la falta de atención a la red neuronal de investigación tuvo mucho que ver con la espera de
computacional de progreso, y que la unrecognizability
resultado de su propio no proporciona una explicación suficiente.