En realidad, este tema es bastante difícil de buscar en Google, ya que "árbol" se ha sobrecargado en este ámbito para referirse a los árboles de decisión.
Me interesaría que un algoritmo de aprendizaje produjera código, como el que se utiliza en la función de Microsoft Power BI para consultar bases de datos mediante lenguaje natural ("Q&A", antes "InfoNav").
Evidentemente, tanto el lenguaje natural como las consultas a las bases de datos pueden expresarse como texto, así que tenemos una buena respuesta: las redes neuronales recurrentes.
Sin embargo, si nos fijamos en las consultas SQL, entonces intuitivamente el trabajo de predicción real se puede simplificar si nos fijamos en su AST representación en lugar de la textual.
Si tuviéramos que predecir una representación AST, las palabras clave del lenguaje dejarían de atascar el vector de salida a predecir, ya que podríamos utilizar el BNF describir el lenguaje y hacer que las decisiones en cada nodo se representen como un entero o algo similar, junto con otra información (por ejemplo, el contenido de los literales de número/cadena).
¿Existe una forma estándar de enfocar esto? ¿Cuáles son las mejores prácticas en este caso?
La Wikipedia tiene un artículo sobre predicción estructurada Pero, obviamente, se basa en la teoría y en el mundo académico, e incluso los artículos que aparecen son bastante antiguos (para el LD), por lo que me inclino a pensar que no necesariamente me dice mucho sobre las mejores prácticas actuales, si es que las hay...