Sólo por interés personal, no me dedico (aún) profesionalmente a ello. Mi pregunta es sobre el estado de las artes en la digitalización de las matemáticas y hasta qué punto es posible y razonable.
Hay diferentes niveles de digitalización:
- Escaneo OCR de todos los textos matemáticos históricos
- organizar los metadatos de las referencias y los autores (por ejemplo, en forma de gráficos)
- extraer objetos matemáticos (como teoremas, definiciones, etc.)
- extraer pruebas e ideas
- formalizar las matemáticas de manera que puedan ser comprobadas completamente por los demostradores de teoremas
El principal esfuerzo que encontré es https://imkt.org/
Los pasos 3/4 y 5 pueden tener un interés independiente y deben entenderse de forma más paralela que cronológica. El punto 5 es más interesante por tener unas matemáticas formalizadas (sin errores). También debería permitirse elegir diferentes fundamentos de las matemáticas y la posibilidad de cambiar entre ellos. El punto 3/4 es más interesante para un investigador que quiere todas las referencias para una definición, un teorema, una palabra clave. Sería una fuente maravillosa para hacer análisis de datos del conocimiento matemático (histórico, social, semántico, etc.). En cambio, el 5 puede contener errores y especulaciones. El interés principal es identificar y referenciar los objetos matemáticos sobre todos los textos producidos en la historia de las matemáticas.
Mi pregunta es:
El objetivo de https://imkt.org/ es enorme, pero al ver sus primeros proyectos parece (lo siento) un poco decepcionante. El enfoque principal (también de otra literatura que he escaneado) radica en la conexión de las bases de datos y los lenguajes existentes, es decir, de los demostradores de teoremas, los sistemas de álgebra computacional (y tal vez los wikis). Entiendo que diferentes aplicaciones en matemáticas exigen diferentes sistemas (por ejemplo, series de enteros http://oeis.org/ también debería formar parte de ella). ¿Puede o no debe haber un sistema que contenga todo aquello a lo que se puede acceder (¡y se almacena, no sólo se hace referencia!) a través del mismo sistema? ¿Son mis sueños de un sistema así exagerados?
-
Uno de los mayores problemas es el de los derechos de autor de las grandes editoriales. Cada vez se va más en dirección a las matemáticas abiertas. Hasta entonces no está no está claro hasta qué punto una biblioteca puede ser completa (las lagunas son de alguna manera no es el objetivo de este sistema).
-
La otra cuestión es la eficiencia en la producción de la extracción de contenidos y avanzar anunciando las ventajas de dicha biblioteca a los matemáticos de tal manera que se mueva por sí misma en algún momento.
Ha habido muchos esfuerzos en el pasado que fueron abandonados de nuevo o aquí durante años (como Mizar ), pero está lejos de ser conocido y utilizado en las matemáticas cotidianas.
5 votos
Puede consultar la IMU y sus esfuerzos en el WDML. Parte de la idea es archivar sitios como MathOverflow que muestran el desarrollo (relativamente informalizado) de las matemáticas en este siglo. Gerhard "Says 'Informalized' Is A Word" Paseman, 2020.07.15.
0 votos
Hasta ahora sólo he encontrado artículos que analizan sistemas existentes o que sofistican de forma abstracta las propiedades que debería tener una biblioteca perfecta. ¿Conoces algún esfuerzo concreto reciente de construcción de un sistema perfecto? ¿Y puedes darme un enlace para ese esfuerzo de la IMU? Parece interesante.
0 votos
IMU es la Unión Internacional de Matemáticas. WDML es World Digital Mathematics Library. Creo que puedes encontrar los enlaces tan bien o mejor que yo. Gerhard "Ingrid lo publicó aquí" Paseman, 2020.07.15.
3 votos
Hay un lento progreso hacia el punto 5 (véanse varias bibliotecas que han crecido en torno a sistemas como Coq y Mizar), pero por el momento nada demasiado alto puede crecer en este campo, ya que la mayoría de los lenguajes de prueba son demasiado inestables y no se sienten como "lo correcto" (por lo que cualquier trabajo realizado ahora probablemente tendrá que ser minuciosamente adaptado en 10 años, si no antes). La mayoría de las veces, estas bibliotecas están escritas por humanos, normalmente inspirados en la literatura existente, pero de ninguna manera traduciéndola directamente. Tal vez la IA pueda hacer esto dentro de 20 años, pero incluso eso está lejos de ser un hecho.
2 votos
No estoy seguro de haber entendido bien el punto 3: Si lo he entendido bien, le gustaría tener una base de datos que contenga teoremas, definiciones, etc., y que enlace con los libros de artículos, etc., donde se utilizan. Sin embargo, tengo la impresión de que esta idea subestima la diversidad de la literatura matemática, incluso dentro de subáreas muy específicas: Por ejemplo: ¿Cuál es precisamente el enunciado del teorema del punto fijo de Banach? ¿Qué es "el" teorema de Perron-Frobenius en el análisis matricial? ¿Qué dice el teorema de existencia y unicidad de las EDO? Y estos son sólo ejemplos bastante suaves...
0 votos
Soy consciente de que a veces no hay una formulación única de un teorema. Eso no es un problema. Un sistema/base de datos perfecto trataría de capturar exactamente en una forma legible por la máquina cómo un libro de texto establece un teorema. Usando algún ML se agregan teoremas de enunciados similares (los "mismos") y se muestran en una vista frontal. Tal vez enumerando en primer lugar la versión más enunciada y haciendo referencia a otras formulaciones, etc.
0 votos
En primer lugar se necesita una buena estrategia de cómo almacenar las declaraciones. Una vez definida ésta, el proceso de agregación y vinculación por ML y el frontend del motor de búsqueda, de fácil uso, pueden ser independientes y mejorarse cada vez más con el paso de los años.
1 votos
"El mismo teorema" es mucho más problemático de lo que crees. Permítame señalar una situación especialmente problemática. Los fundamentos de la geometría algebraica fueron completamente rehechos en los años 60 por Grothedieck y otros, hasta el punto de que a los geómetras algebraicos modernos les resulta muy difícil leer el texto estándar de Hodge y Pedoe de los años 50. Se introdujo una clase de objetos mucho más amplia, y los objetos estudiados anteriormente se redefinieron de manera diferente. (continuación)
1 votos
Algunos teoremas antiguos se generalizaron a (al menos una parte de) la nueva clase de objetos haciendo la traducción "obvia" al nuevo lenguaje; otros se generalizaron pero requirieron pruebas realmente nuevas; otros siguieron siendo verdaderos sólo para los objetos "clásicos" (redefinidos). ¿En qué casos tenemos el "mismo teorema"?