9 votos

Cómo determinar la correcta InChI para un determinado compuesto?

Digamos que tengo un compuesto de L-xilulosa-1-fosfato y quiero saber su correcta InChI, ¿cómo hacerlo? La razón que pido es porque cuando voy a las diferentes bases de datos puedo obtener diferentes resultados:

ChEBI:

$\ce{C5H11O8P}$

InChI=1S/C5H11O8P/c6-1-3(7)5(9)4(8)2-13-14(10,11)12/h3,5-7,9H,1-2H2,(H2,10,11,12)/t3-,5+/m0/s1

NIKKAJI; enlace tomado de KEGG:

$\ce{C5H11O8P}$

InChI=1S/C5H11O8P/c6-3-1-12-5(8,4(3)7)2-13-14(9,10)11/h3-4,6-8H,1-2H2,(H2,9,10,11)/t3-,4+,5?/m0/s1

ModelSeed:

$\ce{C5H10O8P}$

InChI=1S/C5H11O8P/c6-3-1-12-5(8,4(3)7)2-13-14(9,10)11/h3-4,6-8H,1-2H2,(H2,9,10,11)/t3-,4+,5?/m0/s1

Así, ChEBI y NIKKAJI muestran la misma fórmula química pero diferente InChI expresiones, mientras que NIKKAJI y ModelSeed difieren en cuanto a su fórmula química, pero tienen la misma InChI (que parece mal, como ModelSeed del InChI sugiere que también als 11 Hs). Pero eso todavía no explica las diferencias de los dos primeros...

Que todo se ve muy sospechoso para mí; ¿cómo puedo decidir cual de las bases de datos me muestre la información correcta? Es posible que uno recibe el mismo InChI para los compuestos que difieren en su fórmula química (pensé que esto no sería posible)?

11voto

NotNicolaou Puntos 696

Uno de los objetivos de la InChI proyecto era garantizar la unicidad: [1]

Estricto de la singularidad de identificador

La misma etiqueta significa siempre la misma sustancia, y la misma sustancia siempre recibe la misma etiqueta (bajo las mismas condiciones de etiquetado). Esto se logra a través de una bien definida procedimiento de obtención de la canónica de numeración de los átomos.

Si bien esto es a menudo el caso para InChI cadenas, hay algunos (complejo) ejemplos en los que el objetivo de arriba no se ha cumplido, por ejemplo en el producto natural Spongistatin (abajo) donde dos isómeros por cierto tienen el mismo InChI clave: [2]

enter image description here

InChI=1S/C63H95ClO21/c1-33(19-42(67)18-17-35(3)64)20-53-55(72)57-39(7)58(79-53)59(73)63(75)31-51(70)37(5)52(85-63)16-14-12-13-15-44-22-43(68)27-61(81-44)29-47(76-11)23-45(82-61)25-50(69)38(6)56(78-41(9)66)36(4)34(2)21-49-28-60(10,74)32-62(84-49)30-48(77-40(8)65)24-46(83-62)26-54(71)80-57/h13,15,17-18,36-39,42-49,51-53,55-59,67-68,70,72-75H,1-3,12,14,16,19-32H2,4-11H3/b15-13-,18-17+/t36-,37+,38+,39+,42+,43+,44+,45-,46+,47+,48-,49+,51-,52-,53-,55+,56+,57-,58+,59+,60+,61+,62+,63-/m0/s1

Aunque InChI se pueden romper a veces (como por encima de la mayoría de los problemas con InChI son las cadenas de caracteres con la implementación (cómo la estructura se analiza a la cosa de la generación de la cadena en el primer lugar). Varios (común) las funciones son en la actualidad el apoyo de la onu por el InChI aplicación:

  • Polímeros
  • Complejo organometallics
  • Markush estructuras
  • Mezclas
  • Confórmeros
  • Estado de excitación y de espín de los isómeros
  • Local estereoquímica/quiralidad
  • Topológico de isómeros
  • Moléculas de racimo
  • Polimorfos
  • Inespecíficos de enriquecimiento isotópico
  • Reacciones

Generación de cadenas InChI

InChI es, por naturaleza, un algoritmo diseñado para ser ejecutado por una computadora. Mientras que las cadenas pueden ser analizados por los seres humanos (con ennough esfuerzo), la complejidad de las cadenas es tal que es difícil para asegurarse de que está correcta. El InChI FAQ trata específicamente este:

Usted no debe hacerlo (aunque se puede). Esto puede darle al parecer razonable respuestas, pero es propenso a errores y puede romper las relaciones en el InChI.

La más reciente aplicación de InChI es proporcionada por el InChI confianza, de código abierto y gratuito.[3]

Como se mencionó anteriormente, una fuente común de InChI errores es la manera en que la estructura de interés se pasa al algoritmo en lugar de con un defecto fundamental con el proceso utilizado para generarla. Sh*t en, sh*t, por así decirlo.

Para dar un ejemplo concreto, considere la posibilidad de la heterocíclicos sistema a continuación:

enter image description here

enter image description here

Claramente, los dos tautómeros las formas no puede ser distinguido químicamente, pero dependiendo de cómo el InChI cadena se genera, que puede llegar a tener el mismo o en diferentes cadenas. En este caso, es necesario especificar el InChI algoritmo si queremos solucionar los hidrógenos (para mostrar un único tautómero, cada uno de los cuales tendría un único InChI cadena), o no solucionarlos (de tal manera que ambos tautómeros tienen el mismo InChI cadena)

Validación

La verdadera pregunta posiblemente esté interesado en no How to determine the correct InChI for a certain compound?, sino How to validate an InChI string for a certain compound?.

Dada la complejidad de las InChI cadenas, esto es una cosa difícil, y que yo sepa no hay ninguna herramienta que permite que una cadena se proporcionan y dice que si es válida o no (del mismo modo que usted no puede proporcionar una propuesta de la IUPAC nombre a cualquier herramienta que va a decir si es la IUPAC nombre preferido).

Una cosa que puedes hacer es utilizar el InChI cadena para generar una estructura (ChemDraw hace esto). El uso de las cadenas de la cuestión, es evidente que se refieren a las diferentes formas de la molécula cíclica (vs acíclicos, solo imaginen el terminal de alcohol primario atacar la cetona).

enter image description here

Químicamente, puede ser que el cíclicos y acíclicos formas están en equilibrio - en este caso no hay ninguna manera de que InChI para representar la mezcla (y, por tanto, que la estructura usada para generar la cadena es ambiguo). También podría ser que ellos son separables químicamente y no interconvertir, en cuyo caso, con bastante razón, que deben tener diferentes InChI cadenas.


[1]: Revista de Cheminformatics, 2015, 7, 23

[2]: http://www-jmg.ch.cam.ac.uk/data/inchi/ Consultado el 3-Sep-2017

[3]: http://www.inchi-trust.org/about-the-inchi-standard/ Consultado El 3-Sep-2017

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X