Usted puede mirar en el Capítulo 3 de Devroye, Gyorfi, y Lugosi, Un Probabilística de la Teoría de Reconocimiento de patrones, Springer, 1996. Véase, en particular, el apartado de $f$-divergencias.
$f$-Divergencias puede ser visto como una generalización de Kullback--Leibler (o, alternativamente, KL puede ser visto como un caso especial de un $f$-Divergencia).
La forma general es
$$
D_f(p, q) = \int p(x) f\left(\frac{p(x)}{q(x)}\right) \, \lambda(dx) ,
$$
donde $\lambda$ es una medida que domina las medidas asociadas con $p$ y $q$ y $f(\cdot)$ es una función convexa de satisfacciones $f(1) = 0$. (Si $p(x)$ y $q(x)$ son densidades con respecto a la medida de Lebesgue, basta con sustituir la notación $dx$ $\lambda(dx)$ y ya está bueno para ir.)
Queremos recuperar KL tomando $f(x) = x \log x$. Podemos obtener la Hellinger diferencia por $f(x) = (1 - \sqrt{x})^2$ y obtenemos el total de la variación o $L_1$ distancia tomando $f(x) = \frac{1}{2} |x - 1|$. El último da
$$
D_{\mathrm{TV}}(p, q) = \frac{1}{2} \int |p(x) - q(x)| \, dx
$$
Tenga en cuenta que esta última, al menos te da un número finito de respuesta.
En otro pequeño libro titulado Estimación de Densidad de: $L_1$ Ver, Devroye sostiene firmemente por el uso de esta última distancia debido a sus excelentes propiedades de invariancia (entre otros). Este último libro es, probablemente, un poco más difícil de conseguir que la anterior y, como sugiere el título, un poco más especializado.
Anexo: a Través de esta pregunta, me di cuenta de que parece que la medida que @Didier propone es (hasta un constante), conocida como la de Jensen-Shannon Divergencia. Si sigues el enlace a la respuesta de esa pregunta, verás que resulta que la raíz cuadrada de esta cantidad es en realidad una métrica y fue reconocida previamente en la literatura para ser un caso especial de un $f$-divergencia. Me pareció interesante que nos parecen colectivamente han "reinventado" la rueda (con bastante rapidez) a través de la discusión de esta cuestión. La interpretación que yo le había dado en el comentario de abajo @Didier respuesta también fue reconocido previamente. Todo, bueno, en realidad.