Sabemos que un enfoque para re-parametrizar los gradientes para la inferencia variacional es tomar el estimador Gumbel-softmax propuesto en [1] y [2].
En [3], que es una charla sobre IVS, D. Blei, en torno al minuto 29:31, menciona que no hay una re-parametrización para las variables discretas en el caso de las VI (también en las diapositivas). La charla es un año posterior a los documentos. Dado que me parece muy poco probable que algo así haya pasado desapercibido para un experto en la materia, ¿qué me estoy perdiendo?
Más concretamente, las preguntas que tengo son las siguientes:
- ¿Se considera que el truco de Gumbel softmax ha resuelto de forma satisfactoria la cuestión de los gradientes de baja varianza en el IVS con re-parametrización o no?
- ¿La afirmación de la charla es simplemente inexacta?
Esto no debe percibirse como una crítica a la charla, que, por cierto, recomiendo encarecidamente. Lo que pido es que se aclare mi confusión sobre el tema.
[1]: Reparametrización categórica con Gumbel-Softmax ( https://arxiv.org/pdf/1611.01144.pdf )
[2]: La Distribución Concreta: Una relajación continua de las variables aleatorias discretas ( https://arxiv.org/abs/1611.00712 )
[3]: Charla de D. Blei sobre IVS: https://www.youtube.com/watch?v=-H2N4tVDK7I