Al igual que en los modelos de contaminación, algunas distribuciones tienen un componente discreto. Por ejemplo $p(x) := (1 - \epsilon) q(x) + \epsilon \delta_{x_0}(x)$
En estas distribuciones, ¿hay alguna forma de justificar una definición de divergencia KL?
Por ejemplo $D(p_1 || p_2) = D((1 - \epsilon_1) q_1(x) || (1 - \epsilon_2) q_2(x)) + \epsilon_1 \log \frac{\epsilon_1}{\epsilon_2}$