81 votos

Teoremas que impidieron el progreso

Puede ser que ciertos teoremas, cuando resultó ser cierto, contradictorio retard el progreso en ciertos dominios. Lloyd Trefethen proporciona dos ejemplos:

  • Faber del Teorema en el polinomio de interpolación: Interpreta como diciendo que el polinomio interpolants son inútiles, pero son bastante útil si la función es Lipschitz continua.
  • Escudero del Teorema de hidrodinámicos de inestabilidad: se Aplica en el límite de $t \to \infty$ pero (nondimensional) $t$ es rara vez más de $100$.

Trefethen, Lloyd N. "Inversa Yogiisms." Los avisos de la Sociedad Matemática Americana 63, no. 11 (2016). También: El Mejor de la Escritura en Matemáticas 2017 6 (2017): 28. Búsqueda de libros de Google enlace.

En mi propia experiencia, he sido testigo de varias negativas de los resultados de los teoremas de demostrado en

Marvin Minsky y Seymour A. Papert. Perceptrones: Una Introducción a la Geometría Computacional, 1969. MIT Press.

impiden el progreso en la neuro-red de investigación durante más de una década.1

Q. ¿Cuáles son otros ejemplos de teoremas cuya (correcto) pruebas (posiblemente temporal) suprimen la investigación avance en matemáticas subcampos?


1

Olazaran, Mikel. "Un estudio sociológico de la historia oficial de los perceptrones de los siglos". Estudios sociales de la Ciencia 26, no. 3 (1996): 611-659. Resumen: "[...]me dedique especial atención a las pruebas y los argumentos de Minsky y Papert, que fueron interpretados como muestra de que la mayor progreso en las redes neuronales no era posible, y que este enfoque de la IA tuvo que ser abandonado.[...]" RG enlace.

49voto

silviot Puntos 210

No conozco la historia, pero he oído decir que la comprensión de que los grupos superiores de homotopía son abelianos hace que la gente piense que la noción fue inútil durante algún tiempo.

35voto

Dima Pasechnik Puntos 5894

Yo votaría por la clasificación de los finitos simples grupos como un ejemplo de un (esperemos correctamente probado) teorema de los que impidieron el progreso en el campo desde que se anunció para ser probado.

Y un ejemplo clásico son de Hilbert teorema en la teoría de invariantes que se detuvo constructivo teoría de invariantes durante casi 100 años---aquí uno debe citar Rota: "Como el Árabe fénix surgiendo de sus cenizas, la teoría de la de invariantes, pronunciado muerto en el cambio de siglo, está una vez más en la vanguardia de las matemáticas".

33voto

MIsbell37 Puntos 26

Yo no soy un experto, pero sé que uno de los resultados más importantes de la teoría de la información, el teorema de muestreo de Shannon, fue bastante limitante. Muchos trabajos se cree que tienen errores en ellos, porque parecía que se estaban violando de este teorema, hasta que el comprimido de detección llegó.

Una cita de aquí:

En otros campos, tales como la resonancia magnética, los investigadores también descubrieron que podían "undersample" los datos y aún así obtener buenos resultados. En reuniones científicas, Donoho dice,que siempre encontró con escepticismo, porque ellos estaban tratando de hacer algo que se supone que iba a ser imposible. En retrospectiva, él dice que se necesita una especie de matemática "certificado," un sello de aprobación de garantía cuando el muestreo aleatorio obras.

33voto

Fil Puntos 1651

Me han dicho que Thurston del trabajo en las foliaciones (por ejemplo: Thurston, W. P., la Existencia de codimension-uno foliaciones, Ann. de Matemáticas. (2) 104 (1976), no. 2, 249-268) esencialmente terminó el tema durante algún tiempo, aunque todavía hay mucho trabajo por hacer.

Aquí está una cita de su Prueba y el Progreso en Matemáticas:

"Primero voy a discutir brevemente la teoría de foliaciones, que fue mi primer tema, a partir de cuando yo era un estudiante de posgrado. (No importa aquí si usted sabe lo que foliaciones son.) En ese momento, foliaciones se había convertido en un gran centro de atención entre los geométricas topologists, los sistemas dinámicos de la gente, y el diferencial de los geómetras. Yo con bastante rapidez, demostró unas grandes teoremas. Me resultó una clasificación teorema de foliaciones, dando una condición necesaria y suficiente para un colector para admitir una foliación. Me resultó un número de otros teoremas. Escribí respetable papeles y publicado, al menos, los más importantes teoremas. Fue difícil encontrar el tiempo para escribir a seguir con lo que he podido probar, y he construido una cartera de pedidos. Un fenómeno interesante se produjo. Dentro de un par de años, una dramática evacuación del campo comenzó a tomar lugar. He oído de un número de matemáticos que estaban dando o recibiendo el consejo de no ir en las foliaciones-ellos estaban diciendo que Thurston fue la limpieza de salida. La gente me dijo (no como una queja, sino como un cumplido) que me estaba matando el campo. Los estudiantes de posgrado dejado de estudiar las foliaciones, y bastante pronto, me dirigí a otros intereses. No creo que la evacuación se produjo debido a que el territorio era intelectualmente agotada-no eran (y todavía son) muchas preguntas interesantes que quedan y que son probablemente accesible."

29voto

Boinst Puntos 111

El trabajo en redes neuronales, ciertamente, perdió el favor siguientes a la publicación de Minsky y Papert en 1966-67. Sólo he desnatada porciones de la sociología de papel que se hace referencia en la pregunta, pero otras circunstancias sugieren que el tema podría haber disminuido en popularidad incluso sin sus resultados.

Rosenblatt del perceptrones ciertamente había creado un montón de entusiasmo, tal vez la primera gran ola de entusiasmo acerca de la IA (que más tarde fue seguido por la década de 1980 entusiasmo acerca de la regla basada en la "sistemas expertos" y la corriente de excitación sobre neural net y otros de la máquina de aprendizaje técnicas). Una historia involucra a un informe de la conferencia sobre la el desarrollo de un tipo perceptrón que podría detectar con precisión la presencia de tanques del ejército en las fotografías de los campos y los bosques: los insumos que intervienen la digitalización de cada fotografía en 16 píxeles.

Gran parte del entusiasmo alrededor de perceptrones devengados a la convergencia de los teoremas de garantizar que si un tipo perceptrón podría decidir alguna cuestión, el aprendizaje básico procedimientos de converger en una adecuada red pesos. Estos teoremas todos los que juegan fuera de la lineal umbral para perceptrones. Me imagino que muchos de tipo perceptrón publicaciones ascendieron a un recuento de algunos de resultado estándar acerca de transformaciones lineales en la configuración de tipo perceptrón.

Entonces, Minsky y Papert importante papel dirigido a matemáticos apareció, con el título de "Linealmente irreconocible patrones". Este título es a la vez preciso y engañoso en su propio derecho.

El título es exacta debido a que el principal resultado fue que algunos modelos no son reconocibles por lineal umbral de máquinas. Pero obviamente, este resultado por sí solo no condena las redes neuronales. Si transformaciones lineales no son adecuados para caracterizar algunos de los patrones de interés, cómo sobre polinomios? Trigonométricas y funciones exponenciales? No hubo falta de alternativas disponibles para el estudio.

El título es engañoso en que no hace ninguna mención de Minsky y Papert segundo principal resultado, que incluso al considerar sólo linealmente-patrones reconocibles, los sabios de pesos requeriría astronómicamente tamaño de precisión, y por lo tanto cantidades astronómicas de datos para determinar estos pesos.

Así que la red neuronal investigadores se enfrentaron a dos problemas:

Las computadoras eran ridículamente pequeñas en comparación con las máquinas de hoy en día, y el cantidad de datos que se podía obtener era muy pequeño en comparación con la gran las cantidades disponibles hoy en día. Durante décadas, la falta de datos suficientes, y de máquinas capaces de manipular estos datos, impidió que muchas partes de AI, simbólico y nonsymbolic.

También, la red neuronal métodos no eran explicables. Minsky y otros defendido heurística y simbólico métodos, cuyas respuestas y acciones pueden ser explicado en términos que significan algo para la gente. En contraste, de los nervios funcionan las redes sociales como cajas negras, sistemas capacitados para proporcionar un la respuesta, pero incapaz de ofrecer ninguna explicación significativa a personas. Esta limitación persiste hasta el día de hoy. Durante décadas, es proporciona un fácil réplica a la neural net proponentes, en muchos campos tales como el diagnóstico médico, nadie lo va a seguir las recomendaciones de la máquina sin explicaciones razonables.

Las circunstancias han cambiado desde entonces. Hinton y otros persistieron en el desarrollo de técnicas para redes multicapa, la investigación de ideas basadas en métodos no lineales de la física clásica. La velocidad de procesamiento y la disponibilidad de datos han aumentado. También los recientes soluciones de problemas interesantes, tales como la no-trivial, Vaya, han dado mucho de una razón para considerar el uso de redes neuronales, incluso sin explicability.

Así que me parece que el la falta de atención a la red neuronal de investigación tuvo mucho que ver con la espera de computacional de progreso, y que la unrecognizability resultado de su propio no proporciona una explicación suficiente.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X