25 votos

Resultados reproducibles más buscados en álgebra computacional

Estoy interesado en sugerencias para obtener importantes resultados computacionales con la ayuda de software matemático pero que no sean fácilmente verificables usando computadoras.

"Más buscados" podría referirse, por ejemplo, a lo siguiente:

  • resultados que son altamente citados/reutilizados en otras publicaciones/computaciones
  • demostraciones computacionales de resultados fundamentales
  • contraejemplos a conjeturas centrales en un campo
  • verificar la corrección de diversas bases de datos matemáticas
  • producir implementaciones de código abierto de cálculos realizados previamente usando otro software de código abierto o cerrado, o cuando el código antiguo no está disponible en absoluto
  • cálculos emblemáticos que uno podría estar interesado en reproducir (de la misma manera en que una reacción de química de un libro de texto se podría reproducir mezclando bicarbonato de sodio y vinagre en tu cocina).

Si la publicación simplemente dice "este resultado se produjo usando el sistema X", puede ser un largo camino para reproducirlo. Puede incluir una referencia a la versión exacta del sistema, un enlace para descargar el código adicional, pero nuevamente puede suceder que esa versión tenga que instalarse de alguna manera particular para satisfacer ciertas dependencias, el código adicional no esté bien documentado por lo que no está claro cómo ejecutarlo, se necesite algún otro conocimiento especial o recursos computacionales no triviales, etc.

Por otro lado, tener estos resultados más fáciles de reproducir podría ser crucial para la ciencia. Hipotéticamente, uno podría, por ejemplo, descargar una máquina virtual y volver a ejecutar todo el experimento, o utilizar la versión más reciente del sistema para comprobar si el experimento todavía se ejecuta con el mismo resultado.

Espero que hacer una lista de experimentos sugeridos a reproducir sea útil para aquellos interesados en verificarlos dos veces ;-). Por ejemplo, uno podría enviar sus hallazgos a una revista como ReScience que "se centra en la investigación computacional y fomenta la replicación explícita de investigaciones ya publicadas, promoviendo nuevas implementaciones de código abierto para asegurar que la investigación original sea reproducible".

Nota: también se aceptan sugerencias sobre la verificación computacional de resultados teóricos previamente obtenidos y referencias a experimentos reproducibles existentes.

12voto

Dietrich Burde Puntos 28541

No estoy seguro si el resultado es "más buscado", pero refutamos una conocida conjetura de John Milnor, que todo grupo de Lie soluble conectado admite una estructura afín invariante a la izquierda, mediante un cálculo muy complicado relacionado con un refinamiento del teorema de Ado para álgebras de Lie. Demostramos el siguiente resultado, proporcionando un contraejemplo a la conjetura de Milnor:

Teorema: Existen álgebras de Lie nilpotentes de dimensión $10$ y clase de nilpotencia $9$ sobre un campo de característica cero que no admiten ninguna representación lineal fiel de dimensión $11$.

Referencia: Estructuras afines en nilvariedades, $1996$. Consulte allí para referencias y la prueba de Yves Benoist para dimensión $11$. Los cálculos se han realizado con "Reduce", que es de código abierto. Willem de Graaf (también experto en GAP) y otros expertos en álgebra computacional han confirmado que estos cálculos son muy difíciles; recientemente los cálculos se han reutilizado para mostrar que no todo grupo soluble $p$ admite una estructura de paréntesis izquierdo - ver aquí. Esto proporciona nuevamente un contraejemplo (a una conjetura bien conocida sobre estructuras de paréntesis), pero esta vez sobre representaciones fieles de álgebras de Lie sobre característica $p>0$.

7voto

Creo que la enumeración de grupos finitos de un orden dado está definitivamente entre los experimentos reproducibles más deseados. Aquí "enumeración" significa proporcionar una lista completa y no redundante de grupos, "completa" significa que no faltan grupos en esta lista, y "no redundante" significa que los grupos de esta lista son no isomorfos entre sí. Garantizar estas propiedades es crucial para resultados que dependen de verificar todos los grupos de un orden dado, o que se refieren a un grupo en particular por su "número de catálogo".

La colección más completa de grupos de ciertos órdenes está disponible en el sistema GAP a través de varios paquetes interconectados:

En conjunto, esto proporciona algunas colecciones precalculadas de grupos para algunos órdenes, así como funciones para construir todos los grupos de un orden dado para algunas series infinitas. Ninguno de estos paquetes es en realidad solo una base de datos que almacena ciertos grupos, ya que incluso los paquetes que predominantemente proporcionan bases de datos también implementan algoritmos para construcciones genéricas de grupos de orden $p^n$ para algunos $p$ y $n$, y para grupos de órdenes libres de cuadrados. Estos paquetes están estrechamente interconectados: por ejemplo, mientras que GrpConst se utilizó para construir algunos grupos de la biblioteca SmallGroups, también utiliza la biblioteca SmallGroups para enumerar grupos de algunos otros órdenes.

Es muy importante tener resultados tan cruzados y reproducibles como sea posible: incluso si la parte de base de datos de las bibliotecas permanece sin cambios, eso no garantiza que cualquier otro cambio en GAP y/o estos paquetes no vaya a romper el código. Por supuesto, se han realizado muchas comprobaciones cruzadas, y esta funcionalidad se considera muy confiable:

  • Los números de grupo en la biblioteca SmallGroups se cruzan en gran medida, se calculan utilizando enfoques diferentes y también se comparan con los resultados teóricos, cuando están disponibles (ver [Hans Ulrich Besche, Bettina Eick y Eamonn O'Brien. UN PROYECTO DEL MILENIO: CONSTRUCCIÓN DE GRUPOS PEQUEÑOS. Int. J. Álgebra Computacional. 12, 623 (2002), http://dx.doi.org/10.1142/S0218196702001115], en particular 4.1. Confiabilidad de los datos).

  • El paquete Cubefree se comprobó con la Biblioteca SmallGroups y el paquete IRREDSOL como se describe en http://www.gap-system.org/Manuals/pkg/cubefree/htm/CHAP002.htm#SECT005.

  • El conjunto de pruebas estándar de GAP, que se ejecuta todas las noches y es parte del flujo de trabajo de preparación de la versión, incluye pruebas de ConstructAllGroups del paquete GrpConst.

Pero las herramientas modernas nos permiten hacer aún más, y en particular mejorar la situación para órdenes donde no están disponibles colecciones precalculadas de todos los grupos. Recientemente he iniciado un "Proyecto de Reproducibilidad de Números de Grupo" (que fue inspirado por algunas preguntas bajo la etiqueta 'groups-enumeration' tag aquí - ver en particular esta). Este proyecto utiliza un enfoque de colaboración para reunir una base de datos de números de tipos de isomorfismos de grupos finitos. En otras palabras, completa la tabla de valores de la función $gnu(n)$, que devuelve el número de tipos de isomorfismos de grupos finitos de orden n (por lo tanto, "gnu" significa el "NÚmero de Grupo"). Reúne datos de varias fuentes, incluidos valores calculados en tiempo de ejecución utilizando los paquetes mencionados anteriormente y números publicados por el grupo AG Álgebra y Matemáticas Discretas de la TU Braunschweig en http://www.icm.tu-bs.de/ag_algebra/software/small/number.html. Además, acepta informes sobre nuevos valores, no disponibles en ninguna de las fuentes mencionadas anteriormente y sobre la recomputación de valores previamente conocidos. Los datos se agregan a la base de datos solo después de que sean replicados por el administrador. El proyecto también utiliza dos otras designaciones para las presentaciones: "reproducido", cuando se obtuvo el mismo resultado utilizando otra implementación, y "de acuerdo con la teoría", cuando corresponde al resultado teóricamente demostrado.

En la versión actual de la base de datos, el valor de $gnu(n)$ está disponible desde el nivel del sistema de álgebra computacional (desde GAP local o remoto, y desde cualquier otro cliente SCSCP de forma remota). Usando el historial de control de versiones, uno también podría acceder a información de procedencia (tiempo de ejecución, versiones del software, etc.). Esto podría ser útil para los investigadores interesados en producir la lista de todos los grupos localmente, ya que pueden verificar si alguien más ya ha intentado hacer esto y cuánto tiempo esperaron. Desde el inicio del proyecto, casi se han enviado, replicado y agregado a la base de datos casi 200 entradas nuevas, lo que proporciona ahora la tabla de valores conocidos más completa disponible de $gnu(n)$.

Se pueden encontrar más detalles en el archivo README.md en https://github.com/olexandr-konovalov/gnu. Vea también mi presentación "El Álgebra Computacional se Encuentra con la Ciencia Abierta: Proyecto de Reproducibilidad de Números de Grupo".

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X