6 votos

¿A qué se refiere la etiqueta ZZE en un archivo de tabla química?

Tengo un número de Archivos de la tabla química que incluyen un Etiqueta "M ZZE" en el bloque de propiedades .

Por ejemplo, en Galactobuxina lo he hecho:
M ZZE 1 31 23

En Rubrobrassicin lo hay:
M ZZE 3 28 23 36 23 48 23

En R-hexanoil CoA lo hay:
M ZZE 1 55 23

El formato típico de este tipo de etiquetas es el que comienza con una M, seguida de dos espacios. A continuación hay un código de tres letras, en este caso ZZE. Otros códigos son ISO (para isótopos) o CHG (para átomos cargados en el compuesto), y luego un número que indica cuántos registros hay en esa línea. A continuación aparecen los datos reales. Así,
M ZZE 3 28 23 36 23 48 23
probablemente significaría que hay tres conjuntos de datos ZZE, siendo "28 23" "36 23" y "48 23". En todos los registros que tengo el segundo número es 23.

Las etiquetas ZZE parecen darse sólo en compuestos que contienen anillos de ribosa, y el primer número es el índice de uno de los enlaces dentro del anillo de ribosa. En concreto, de tres enlaces adyacentes con un marcador de estereoquímica, siempre se refiere al del medio:

Rubrocrassin with ZZEs circled

Supongo que el 23 es alguna propiedad del enlace: así que en la rubrobrassicina los enlaces 28, 36 y 48 (hay un, y sólo un, registro ZZE para cada uno de los anillos de ribosa en la rubrobrassicina).

¿Alguien sabe a qué se refiere la propiedad ZZE en un archivo de tabla química o qué indica? No encuentro ninguna información sobre el formato.

3voto

Jim Puntos 1896

La versión actual de la especificación CTFile puede descargarse gratuitamente de Accelrys. En función de los archivos que tengas, deberás buscar en la sección "V2000".

Respuesta corta: Creo que [M ZZE] es una clave de propiedad específica del proveedor, posiblemente introducida por ACD Labs, dado que es el paquete citado en la cabecera de la línea 2. La especificación del formato CTFile para los archivos V2000 no dice nada sobre una clave de propiedad "M ZZE".

La especificación de CTFile dice que las claves de propiedad que no son reconocidas por el software de análisis sintáctico deben ser ignoradas. Esto hace que las extensiones específicas del proveedor sean factibles.

Parece que su interpretación va por buen camino. La entrada de Galactobuxin tiene esta línea en el bloque de propiedades:

M ZZE 1 31 23

Desglosando esto:

{M ZZE} es la clave de las propiedades misteriosas.

{1} es el número de entradas de datos en la línea.

{31} es el índice basado en 1 de un átomo o de un enlace.

El átomo 31 es uno de los aburridos grupos metoxi.

Por otro lado, el bono 31 es un verdadero niño problemático:

enter image description here

Este archivo abusa del significado de los "enlaces de cuña" al tratar de utilizarlos para indicar la perspectiva de la conformación de la silla, en lugar de para lo que están destinados: la estereoproyección plana. Mi opinión es que el archivo está tratando de anotar este enlace.

La única pregunta que queda es: ¿a qué se refiere {23}?

Bond 23 no es nada destacable. Átomo 23 es uno de los orígenes de un bono de cuña. Pero no está claro por qué debería asociarse con el bono 31.

Mi mejor conjetura es que el software que creó este archivo sabía que estaba abusando de los bonos de cuña y quería incluir una bandera en el bono 31 para que el software que leyera el archivo no lo malinterpretara.

Dado que estás viendo el mismo {23} en todos los archivos, esto podría ser un código para procesar especialmente la bandera estéreo del bono 31.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X