En muchos campos de la ciencia (como la biología, la medicina, la psicología, la estadística o la física), las técnicas de aprendizaje automático e inteligencia artificial son cada vez más populares para analizar datos. ¿Es así también en la química?
Respuestas
¿Demasiados anuncios?La respuesta corta es sí. El aprendizaje automático, la minería de datos, la IA y otras técnicas son muy útiles en química.
Estoy completamente de acuerdo con La respuesta de Fred que el aprendizaje automático, los sistemas expertos y el análisis estadístico en química se remontan a mucho tiempo atrás. Esto es especialmente cierto en la química analítica: cotejar un espectro de masas o RMN o IR con una biblioteca de compuestos conocidos.
Ahora he visto tu etiqueta "química computacional" y aquí hay algunas aplicaciones más nuevas. Básicamente, la pregunta es si se pueden predecir propiedades (por ejemplo, el calor de formación, el momento dipolar, etc.) que normalmente requerirían la mecánica cuántica.
Hay algunos grupos que lo intentan, pero uno de los intentos más exitosos hasta ahora ha sido el de Anatole von Lilienfeld .
Los investigadores descubrieron que con un paisaje de más de 5.000 moléculas, el error de predicción de las energías de atomización de las nuevas moléculas cae por debajo de 10kcal/mol, acercándose a la precisión de 5kcal/mol de la DFT híbrida. Calcular la energía de atomización de una molécula mediante DFT híbrida llevaría una hora de media en una sola CPU", afirma von Lilienfeld. Con el aprendizaje automático, son milisegundos".
Existen enfoques más convencionales para utilizar el aprendizaje automático, los algoritmos evolutivos y similares para realizar la parametrización de los campos de fuerza, la mecánica cuántica semiempírica, etc.
Básicamente, si tienes muchos datos, las técnicas de aprendizaje automático pueden ser formas eficaces de analizar los datos y utilizarlos para otros fines.
Sí. No es algo nuevo en la química; encontrará artículos sobre aplicaciones de la IA química que se remontan a cuatro décadas o más.
Tenemos cantidades masivas de datos que deben ser procesados rápidamente. Por ejemplo, un detector de matriz de diodos en HPLC puede recoger un gran número de espectros por minuto en cientos de longitudes de onda, y tenemos que utilizar esos datos para distinguir y posiblemente identificar dos compuestos de elución cercana que salen de la columna. El análisis de datos inteligente y automatizado y el reconocimiento de patrones son imprescindibles. Muchos sensores de "nariz artificial" tienen requisitos similares; pueden utilizar redes neuronales para responder a preguntas como "¿están estas patatas infectadas de podredumbre seca?" También utilizamos sistemas expertos en diversas áreas de la química analítica.
Aquí hay algunas buenas descripciones de Hugh Cartwright:
Uso de la inteligencia artificial en química y biología: Una guía práctica (CRC Press)
Aplicaciones de la inteligencia artificial en la química (Oxford University Press)
Desarrollo y usos de la inteligencia artificial en la química (Reviews in Computational Chemistry, Volumen 25, Wiley)
Sé que llego un poco tarde a esta fiesta, pero en los últimos años ha habido algunos avances potencialmente muy importantes en la aplicación del aprendizaje automático a la química. Ambos se aplican a la dinámica molecular.
En primer lugar, una observación potencialmente obvia es que al realizar una simulación de dinámica molecular, cada uno de los pasos de tiempo está altamente correlacionado con el paso de tiempo anterior, suponiendo que el paso de tiempo empleado sea lo suficientemente pequeño como para calcular cualquier propiedad significativa. Se trata de una situación perfecta para el aprendizaje automático, ya que significa que después de utilizar algunos de estos pasos de tiempo como fase de entrenamiento, los pasos de tiempo posteriores pueden simularse con una pérdida mínima de precisión de forma extremadamente rápida. Esta idea, y su aplicación a ab initio dinámica molecular, se discute en la ref. [1]. Esto es enorme porque significa con un uso inteligente del aprendizaje automático, ab initio La DM puede ser posible en escalas de tiempo mucho mayores de las que se han hecho antes.
Como punto interesante, una de las claves es que las simulaciones MD se hacen a menudo porque eventualmente se muestrea alguna configuración anormal, pero probablemente importante. Esto significa que se debe implementar un llamado motor de decisión para que el aprendizaje automático pueda desconectarse y comenzar a aprender de nuevo a partir de la configuración inusual. Esto también se describe en la ref. [1].
El segundo avance importante se produce en la construcción de campos de fuerza moleculares, muy utilizados en las simulaciones de DM. El objetivo de estos campos de fuerza es que son mucho más rápidos que la resolución aproximada de la ecuación de Schrodinger. Los campos de fuerza desarrollados a partir del aprendizaje automático resuelven potencialmente dos problemas a los que se enfrentan los campos de fuerza normales. En primer lugar, los campos de fuerza normales sólo son válidos en un contexto muy específico para el que fueron desarrollados. Principalmente, están limitados por la forma funcional sobre la que se construyeron. El aprendizaje automático también tiene el problema de necesitar un conjunto de entrenamiento, pero los campos de fuerza de aprendizaje automático son adaptativos y, por tanto, capaces de volverse más robustos al visitar configuraciones no encontradas anteriormente. En segundo lugar, los campos de fuerza de aprendizaje automático pueden ampliarse a nuevos átomos y tipos de moléculas sin tener que empezar completamente de cero. Al fin y al cabo, las mismas leyes físicas se aplican a diferentes elementos, por lo que el campo de fuerza sólo tiene que aprender, aproximadamente, cómo se aplican esas mismas leyes a los diferentes elementos. Básicamente, es más rápido que empezar de cero. Consideraciones como estas se pueden encontrar en la ref. [2].
También he visto un documento en algún momento que discutía el aprendizaje automático como método para proporcionar mejores conjeturas de la geometría optimizada de un sistema, lo que requeriría menos iteraciones utilizando un método QM. Además, creo haber visto un artículo sobre el uso del aprendizaje automático para encontrar nuevos mínimos en superficies de energía potencial complicadas, como las de los grandes grupos de agua. Esto está relacionado con el punto de la optimización.
Básicamente, las posibilidades son infinitas.
[1] Botu, V., & Ramprasad, R. (2015). Adaptive machine learning framework to accelerate ab initio molecular dynamics. International Journal of Quantum Chemistry, 115(16), 1074-1083.
[2] Botu, V., Batra, R., Chapman, J., & Ramprasad, R. (2016). Campos de fuerza de aprendizaje automático: construcción, validación y perspectivas. The Journal of Physical Chemistry C, 121(1), 511-522.
Si no utilizamos la inteligencia artificial en la química, entonces la química será el único campo entre todos, que no la ha utilizado. Pero la verdad es que ya se ha desplegado mucha inteligencia artificial en la química, sin que sepamos que se está utilizando.
La inteligencia artificial puede resolver casi todos los problemas de la química.
En la wikipedia se puede encontrar un artículo interesante al respecto https://en.wikipedia.org/wiki/Artificial_intelligence_in_chemistry
Muchos químicos piensan que la inteligencia artificial es difícil, pero en realidad es muy fácil. Un químico con conocimientos básicos de informática puede aprenderla en 6-7 días, y puede desplegarla de millones de maneras en la química.
Wiley ha desarrollado una aplicación de inteligencia artificial, un software llamado chemplanner, que puede sintetizar cualquier molécula orgánica del mundo que se le ocurra a un ser humano, en cuestión de segundos, utilizando la literatura de reacciones ya existentes en el mundo. Por lo tanto, con la ayuda de este software de inteligencia artificial de Wiley, se puede sintetizar cualquier molécula orgánica en el mundo.
2 votos
En chemistryworld.com hay una buena serie de artículos sobre el aprendizaje automático en química.
0 votos
El principal reto en este caso es la escasez de grandes conjuntos de datos abiertos en química. Cuando se pueden conseguir los datos, las técnicas de aprendizaje automático suelen funcionar.
0 votos
@chrishmorris ¡Bienvenido a Chemistry.SE! Por favor, toma el tour para familiarizarse con este sitio. He convertido tu respuesta en un comentario, porque en este estado no se ajusta realmente a la filosofía de este sitio.
0 votos
Pruebe Chembrows ( chembrows.com/website ) en paralelo a su búsqueda bibliográfica habitual, y podrá comprobar lo bien que le funciona (o no) la IA (predictiva / sugestiva).
0 votos
Por un lado, el ML ya se utiliza en el desarrollo de medicamentos y en situaciones similares de I+D.