12 votos

Tratando de entender los patrones de SMILES(?)

En el ejemplo de cálculo del paquete de búsqueda de conformadores fafoom es un patrón misterioso que me gustaría entender.

El código SMILES de la estructura de ejemplo dada es:

CC(=O)N[C@H](C(=O)NC)C

Existe un primer patrón no tan duro para el identificador de patrones smart_cistrans

C~[$(C=O)]-[$(NC)]~[C]

que indica al programa que los enlaces peptídicos se comportan como isómeros cis-trans. Eso es relativamente fácil de ver pero no lo entiendo muy bien para adaptarlo en otros problemas.

Pero hay otro identificador para los ángulos de torsión que para mí es aún más difícil de entender:

[*]~[!$(*#*)&!D1]-&!@[!$(*#*)&!D1]~[*]

Los [*] del principio y del final parecen definir cualquier átomo... pero los signos de maldición del medio no me dicen nada.

Querido lector, si entiendes cómo se generan esos patrones, te pediría que los desglosaras pieza por pieza para poder utilizarlos después por mi cuenta.

0 votos

Es interesante ver el enlace a fafoom.. Tendré que investigarlo más a fondo para compararlo con otras herramientas que tengo.

0 votos

Lo encontré ayer, hay un relacionado arXiv-paper .

0 votos

@GeoffHutchison, ¿puedo preguntar qué otras herramientas tienes? :)

10voto

Dylan Beattie Puntos 23222

En primer lugar esto es SMARTS no a las sonrisas.

Piense en SMARTS como un lenguaje de expresión regular para moléculas (por ejemplo, SMILES).

Así que vamos a desglosar algunos de esos personajes:

  • ~ es "cualquier bono"
  • ! es "no"
  • $ indica una expresión SMARTS recursiva.
  • @ indica "cualquier enlace de anillo"

El $(*#*) significa "dos átomos con un triple enlace entre ellos". El !D1 significa y no un átomo con un enlace explícito.

En su conjunto, [*]~[!$(*#*)&!D1] significa cualquier átomo con un enlace a otro átomo que no tenga un solo enlace explícito o un enlace triple.

Básicamente, el patrón trata de encontrar un enlace único en el centro con algunos grupos laterales giratorios: [*]~[...]-&[..]~[*]

Hay una herramienta muy buena llamada Visor SMARTS que pueden ayudar a depurar y construir SMARTS.

enter image description here

Parece que ahora también hay versiones comerciales más pulidas llamadas SMARTStools a través de BioSolveIT incluyendo un editor.

1 votos

Muchas gracias. Pensaba que el "smart_" era sólo una parte de la cadena para señalar que hay algo inteligente detrás y nunca hubiera llegado a pensar en un lenguaje de patrones moleculares. Eso me ha ayudado mucho :)

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X