Estoy de acuerdo en que parece haber una tendencia a utilizar representaciones gráficas en lugar de cadenas SMILES. Personalmente creo que es algo positivo, e intentaré explicar por qué, pero aunque no haya nada intrínsecamente mejor en las representaciones gráficas de las moléculas, hay una razón muy práctica por la que la gente se está decantando por las representaciones gráficas.
Así que, en primer lugar, como usted señala, ambas representaciones adolecen del problema de que son necesariamente una reducción de la cantidad completa de información necesaria para especificar una estructura molecular. Por ejemplo, ni un gráfico ni una cadena SMILES podrían distinguir entre dos isómeros que sólo difieren en la dirección en la que se mueve un isómero libre. $\ce{O-H}$ puntos de grupo. De hecho, un gráfico desnudo no puede diferenciar entre las moléculas de hexano en barco, en silla o planas, ya que todas tienen una conectividad idéntica. No obstante, un grafo es una representación mucho más flexible que una cadena SMILES porque es bastante común añadir pesos a las aristas, que podrían ser distancias de enlace, o añadir parámetros a los nodos, que podrían describir ángulos a otros nodos. Así, se puede incluir información que está en las coordenadas cartesianas, sin tener los problemas asociados con derivar su representación molecular de las coordenadas cartesianas.
Esto indica la razón práctica por la que la gente utiliza representaciones gráficas. Básicamente, los grafos se utilizan en modelos de aprendizaje automático en muchos campos distintos de la química. Así que está muy bien no tener que reinventar la rueda, sobre todo cuando la gente tiene tanto éxito con cosas como el aprendizaje por transferencia, en el que coges un modelo preentrenado y lo reentrenas para tus propios fines.
Además, muy a menudo el primer paso para entrenar una red neuronal es realizar alguna transformación en los datos. Por ejemplo, las redes neuronales convolucionales gráficas han tenido éxito en muchas tareas, así que ¿por qué no utilizar un filtro convolucional en la representación gráfica de una molécula? Podrías hacerlo con una cadena SMILES, pero probablemente primero transformarías la cadena en algo parecido a un gráfico.
En cuanto a sus puntos concretos sobre quiralidad y aromaticidad, etc. Toda esta información puede adjuntarse a un gráfico a través de parámetros propios de cada nodo, aunque personalmente evitaría dar información que no sea estrictamente necesaria. Es decir, no hay nada especial en un enlace que esté en un anillo aromático. Hay que proporcionar datos suficientes para que el modelo pueda aprenderlo por sí mismo. Si le dices que los enlaces en anillos aromáticos son lo suficientemente especiales como para obtener otro parámetro, es probable que esto sesgue el modelo de alguna manera imprevista. La quiralidad se maneja fácilmente con un simple parámetro asociado a cada nodo.
En última instancia, sin embargo, la representación depende mucho del problema que se intente resolver. Por ejemplo, si se trata de aprender una representación de la superficie de energía potencial, los gráficos pueden funcionar bastante bien. Lo que quizá sea más común es utilizar las llamadas funciones de simetría centradas en el átomo. En este caso, las características reales son vectores abstractos que se garantiza que tienen las simetrías relevantes y la suavidad necesaria en la superficie de energía potencial.
Si estás haciendo algo más parecido a un problema de clasificación, entonces usar una representación como una cadena SMILES podría ser perfectamente adecuado.
TL;DR
Los gráficos son una representación más flexible que se utiliza habitualmente en campos ajenos a la química. Por eso, poder aprovechar los conocimientos de otras disciplinas es una gran ventaja, sobre todo cuando se colabora con informáticos que saben mucho de aprendizaje automático y nada de química.