¿Por qué algunas definiciones de la divergencia de Kullback-Leibler incluyen términos adicionales −pi+qi−pi+qi ? Por ejemplo, kl_div()
(en Python scipy.special
) define la divergencia de Kullback-Leibler como ∑ipilnpiqi−pi+qi.∑ipilnpiqi−pi+qi.
La documentación dice:
El origen de esta función está en la programación convexa; véase
[1]
para más detalles. Esta es la razón por la que la función contiene términos adicionales a los que cabría esperar de la divergencia de Kullback-Leibler.
No tengo a mano el libro de referencia. ¿Cuál es la justificación o motivación de los −pi+qi−pi+qi ¿condiciones?
Nota anticierre: No se trata de una pregunta sobre software, sino sobre el concepto que hay detrás.