24 votos

Una biblioteca global de matemáticas

Sólo por interés personal, no me dedico (aún) profesionalmente a ello. Mi pregunta es sobre el estado de las artes en la digitalización de las matemáticas y hasta qué punto es posible y razonable.

Hay diferentes niveles de digitalización:

  1. Escaneo OCR de todos los textos matemáticos históricos
  2. organizar los metadatos de las referencias y los autores (por ejemplo, en forma de gráficos)
  3. extraer objetos matemáticos (como teoremas, definiciones, etc.)
  4. extraer pruebas e ideas
  5. formalizar las matemáticas de manera que puedan ser comprobadas completamente por los demostradores de teoremas

El principal esfuerzo que encontré es https://imkt.org/

Los pasos 3/4 y 5 pueden tener un interés independiente y deben entenderse de forma más paralela que cronológica. El punto 5 es más interesante por tener unas matemáticas formalizadas (sin errores). También debería permitirse elegir diferentes fundamentos de las matemáticas y la posibilidad de cambiar entre ellos. El punto 3/4 es más interesante para un investigador que quiere todas las referencias para una definición, un teorema, una palabra clave. Sería una fuente maravillosa para hacer análisis de datos del conocimiento matemático (histórico, social, semántico, etc.). En cambio, el 5 puede contener errores y especulaciones. El interés principal es identificar y referenciar los objetos matemáticos sobre todos los textos producidos en la historia de las matemáticas.

Mi pregunta es:

El objetivo de https://imkt.org/ es enorme, pero al ver sus primeros proyectos parece (lo siento) un poco decepcionante. El enfoque principal (también de otra literatura que he escaneado) radica en la conexión de las bases de datos y los lenguajes existentes, es decir, de los demostradores de teoremas, los sistemas de álgebra computacional (y tal vez los wikis). Entiendo que diferentes aplicaciones en matemáticas exigen diferentes sistemas (por ejemplo, series de enteros http://oeis.org/ también debería formar parte de ella). ¿Puede o no debe haber un sistema que contenga todo aquello a lo que se puede acceder (¡y se almacena, no sólo se hace referencia!) a través del mismo sistema? ¿Son mis sueños de un sistema así exagerados?

  • Uno de los mayores problemas es el de los derechos de autor de las grandes editoriales. Cada vez se va más en dirección a las matemáticas abiertas. Hasta entonces no está no está claro hasta qué punto una biblioteca puede ser completa (las lagunas son de alguna manera no es el objetivo de este sistema).

  • La otra cuestión es la eficiencia en la producción de la extracción de contenidos y avanzar anunciando las ventajas de dicha biblioteca a los matemáticos de tal manera que se mueva por sí misma en algún momento.

Ha habido muchos esfuerzos en el pasado que fueron abandonados de nuevo o aquí durante años (como Mizar ), pero está lejos de ser conocido y utilizado en las matemáticas cotidianas.

5 votos

Puede consultar la IMU y sus esfuerzos en el WDML. Parte de la idea es archivar sitios como MathOverflow que muestran el desarrollo (relativamente informalizado) de las matemáticas en este siglo. Gerhard "Says 'Informalized' Is A Word" Paseman, 2020.07.15.

0 votos

Hasta ahora sólo he encontrado artículos que analizan sistemas existentes o que sofistican de forma abstracta las propiedades que debería tener una biblioteca perfecta. ¿Conoces algún esfuerzo concreto reciente de construcción de un sistema perfecto? ¿Y puedes darme un enlace para ese esfuerzo de la IMU? Parece interesante.

0 votos

IMU es la Unión Internacional de Matemáticas. WDML es World Digital Mathematics Library. Creo que puedes encontrar los enlaces tan bien o mejor que yo. Gerhard "Ingrid lo publicó aquí" Paseman, 2020.07.15.

25voto

joseph Devitt Puntos 11

Ninguno de sus cinco niveles de digitalización está en absoluto al alcance. Tomemos sólo el primero. Como dices, los derechos de autor son un gran obstáculo. Considere lo que ocurrió cuando Google intentó la misma idea (dando lugar a Google Books), como se explica maravillosamente en este artículo en el Atlantic . Larry Page (como en PageRank) puso en marcha un tremendo esfuerzo para conseguir libros de las bibliotecas y escanearlos en masa con tecnología OCR para hacerlos buscables.

Después de hacerlo durante algún tiempo, los editores presentaron una demanda contra Google. Google contrató a un enorme equipo jurídico porque le importaba mucho crear esa biblioteca. Google consiguió que los editores se sumaran a la idea, señalando que permitiría a los editores vender obras agotadas. Desgraciadamente, esto planteó otro problema, como un triste juego del topo, y el Departamento de Justicia intervino para evitar que Google tuviera un monopolio de facto sobre los libros descatalogados. Al final, el juez impidió el acuerdo que habían pactado Google y las editoriales.

Lo mismo ocurriría en el mundo de las matemáticas. La cuestión es: tienes un montón de autores que murieron hace mucho tiempo y no pueden dar su consentimiento para actualizar sus antiguos contratos de publicación. Tienes editores que no se desprenden de los contenidos a menos que puedan obtener beneficios con ellos. Y no hay ninguna organización lo suficientemente grande como para ser la cámara de compensación central para conectar a los clientes que quieren leer estas obras con los lugares donde pueden verlas y comprarlas. El problema se complica cada año, porque cada vez producimos más matemáticas (y el OCR para las matemáticas no es muy bueno, lo que echa por tierra tu tercera idea). Mi opinión: si Google no pudo reunir una biblioteca global, a pesar de todo el esfuerzo que puso en este problema, no hay esperanza para el resto de nosotros.

6 votos

Así que hay que acabar con el viejo sistema: publicar las matemáticas de nueva creación (y las sinopsis y estudios de las matemáticas más antiguas) bajo una licencia de libre distribución. El hecho de que se haya hecho a la antigua usanza no significa que tenga que seguir siendo así. Gerhard "Deshazte de la tradición,... Tradición!" Paseman, 2020.07.15.

3 votos

Buena respuesta y también buen artículo citado. Y también estoy de acuerdo en parte con tus conclusiones: si el problema se aborda sólo en base al puro interés económico, si Google no ha tenido éxito, nadie lo tendrá. Sin embargo, espero que haya más espacio para la ciencia y un poco menos (pero razonablemente suficiente) para los negocios. Después de todo, el Taj-Mahal, la Basílica de San Pedro, y casi todo lo que ha hecho el hombre y que vale la pena ver, no se ha construido con el objetivo de hacer dinero con ello.

23 votos

De hecho, Biblioteca Génesis es la biblioteca que todo el mundo utiliza hoy en día como primera fuente de libros de matemáticas; las bibliotecas físicas se consultan como último recurso, para los libros raros que no están (todavía) en Library Genesis. Pero hay una gran diferencia entre tener un escaneo y tener un "verdadero PDF" o archivo TeX legible. MathPix es una prometedora herramienta de OCR para fórmulas matemáticas, pero tiene sus límites, y la composición tipográfica puede ser muy diverso. (Por no mencionar que muchos escaneos no son lo suficientemente buenos como para dejar el OCR a las máquinas).

11voto

Chris Puntos 165

En mi opinión, de 2 a 5 no son realistas (y apenas se necesitan), mientras que 1 sí es deseable e importante. Sin duda, en los últimos años se ha avanzado mucho en la consecución de 1. Pero sigue siendo un objetivo remoto.

David White mencionó el principal obstáculo: el vergonzoso sistema de derechos de autor existente. Pero hay otros obstáculos. El número de publicaciones periódicas de matemáticas es realmente enorme, muchas eran propiedad de las universidades y de diversas sociedades en el pasado, y no existe una voluntad real de digitalizar todas estas oscuras publicaciones. Hay muchas publicaciones antiguas de diversas sociedades en la mayoría de los países europeos que todavía no están digitalizadas. Las grandes empresas probablemente no ven ninguna perspectiva de beneficio en esto (y probablemente tengan razón), y los voluntarios tienen cosas más importantes que hacer.

Según tengo entendido, los derechos de autor no se aplican a las revistas de matemáticas de los siglos XVIII y XIX. Aun así, hay poco interés en su digitalización. Pocas de las grandes revistas que aún continúan, han digitalizado los números antiguos (y reclaman derechos de autor por esta digitalización). Pero nadie parece estar interesado en las revistas que no continúan.

En muchos casos, incluso cuando se dispone de una digitalización, la calidad es demasiado pobre para leer o imprimir, o buscar. Los antiguos volúmenes de Comptes rendus están disponibles, pero hay que intentar encontrar algo en ellos. A veces te muestran las páginas "digitalizadas" en la pantalla pero no permiten descargar el archivo pdf del artículo. Así que se supone que hay que imprimir un papel grande página por página, si es que se permite imprimir.

El resultado es fácil de predecir: con la actual desaparición de las bibliotecas habituales, la mayor parte de estas matemáticas simplemente se perderán. Y no se ve ningún remedio realista. No es la primera vez que ocurre algo así: según diversas estimaciones, se perdió cerca del 90% de las matemáticas y la ciencia helenísticas. (Y prácticamente el 100% de la prehelenística griega).

Por supuesto, se puede argumentar que se conservan las obras "más importantes". Por ejemplo, Euclides se conserva, pero no todos sus predecesores. Quizá haya algo de verdad en esto. (Imagínese que de todas las matemáticas del siglo XX sólo se conserva Bourbaki:-)

6 votos

No estoy seguro de estar de acuerdo con su evaluación de los siglos XVIII y XIX. Casi todo hasta 1850 o 1900 está escaneado y disponible en archivos como numdam, gallica, hathitrust, biodiversidad, archive.org que parecen estar a salvo incluso si Google books se cerrara. Después de 1950, más o menos, es otro asunto con, de todos modos, un señal/ruido .

4 votos

La mayoría de las revistas "provinciales" alemanas (que tienen nombres que empiezan por Sitzungsberichte, Abhandlungen, etc., no están digitalizadas, ni siquiera la famosa publicada en Gottingen). Y esto es sólo un ejemplo. La famosa revista rusa Doklady de la Academia no está digitalizada. Sólo disponemos de las traducciones de los pocos años en que se tradujo.

0 votos

Bueno, el enlace lleva a una lista en la que parece que está disponible todo lo de Göttingen (GDZ). Asimismo, Leipzig ( babel , wikisource ).

3voto

skalee Puntos 208

Últimamente se está trabajando mucho en la formalización de grandes partes de las matemáticas clásicas utilizando asistentes de demostración, véase por ejemplo el Proverbios de la ley y la biblioteca que lo acompaña mathlib . Puede ver un resumen de lo que se ha formalizado aquí incluye una gran cantidad de álgebra abstracta clásica y análisis real, aunque también hay una gran cantidad de matemáticas de pregrado que aún no han formalizado y que enumeran aquí . Si crees que todo eso es "trivial", hay trabajos en curso para formalizar la prueba de la independencia del hipótesis de continuidad la prueba de que es posible la esfera etc.

Una faceta interesante de este proyecto es que todas las pruebas se mantienen bajo un sistema de control de versiones y se puede ver todo el historial de cada prueba. Es habitual que la demostración inicial de algún resultado sea muy larga y prolija, y que más tarde la gente encuentre formas de acortarla o hacerla más elegante, como por ejemplo la demostración de von Neumann del teorema de Radon-Nikodym. Mientras que antes había que rastrear las citas de montones de artículos históricos que tal vez ni siquiera tuviera la biblioteca, ahora se puede ver exactamente cómo se desarrolló este proceso con sólo hacer git blame .

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X