2 votos

En VAE, ¿por qué aproximamos p(z|x) utilizando q(z) y no q(z|x)?

Estoy viendo esta conferencia sobre VAE:

https://www.youtube.com/watch?v=uaaqyVS9-rM&t=1507s

y en 26:00, se afirma que el objetivo es minimizar la div. KL entre la distribución que intentamos encontrar - p(z|x) aproximándola con otra distribución: q(z). pero ¿por qué no estamos usando q(z|x)?

1voto

mclaughlinj Puntos 1099

El límite inferior de evidencia que intentamos maximizar es válido para cualquier elección de $q(z)$ por lo que, por ejemplo, podría elegir arbitrariamente $q(z) = \mathcal{N}(0,1)$ pero esto no daría un buen resultado.

Dado que podemos utilizar cualquier $q(z)$ para cualquier $x$ También podríamos tener nuestro $q(z)$ depende en $x$ y se escribe como $q(z|x)$ -- hay que admitir que tal vez alguna notación como $q(z) = r(z;x)$ sería menos confuso.

TLDR: $q(z|x)$ es sólo un caso especial de todos los posibles $q(z)$ que podíamos elegir.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X