Deje $X_1,X_2,\dots$ ser yo.yo.d. muestras tomadas de un espacio discreto $\mathcal{X}$ según la distribución de probabilidad de $P$, y denotan la resultante de distribución empírica basada en n muestras por $\hat{P}_n$. También vamos a $Q$ ser una distribución arbitraria. Es claro que (KL-divergencia)
$KL( \hat{P}_n || Q) \stackrel{n\rightarrow \infty}{\longrightarrow} KL(P || Q)$,
pero me pregunto si existe algún conocido cuantitativa de la tasa de convergencia. Me refiero a si se puede demostrar que
$\Pr\Big[ | KL( \hat{P}_n || Q) - KL(P || Q) | \geq \delta\Big] \leq f(\delta, n, |\mathcal{X}|)$,
y ¿cuál es la mejor expresión de la RHS si es que hay alguno.
Muchas gracias!