Estoy trabajando en el documento original de EM Máxima verosimilitud a partir de datos incompletos por Dempster, et al.
Me he encontrado con un problema con una afirmación que se hace en la sección 3. "Propiedades generales". Específicamente estoy teniendo dificultades con el Lemma 1:
Mi interpretación de la desigualdad de Jensen es
$$ \mathop{E}[f(X)] \geq f(\mathop{E}[X]) \text{ for convex functions } f(x) $$
o a la inversa para funciones cóncavas (por ejemplo, el logaritmo de una pdf).
Si estoy interpretando la ecuación $3.3$ correctamente, tenemos
$$ \mathop{E}[\log k(x|y, \phi')|y, \phi] \leq \mathop{E}[\log k(x|y, \phi)|y, \phi] \\ \implies \int_X \log k(x|y, \phi') p(x | y, \phi) dx \leq \int_X \log k(x|y, \phi) p(x | y, \phi) dx $$
No consigo ver dónde se aplica la desigualdad de Jensen ya que ambos lados de la ecuación incluyen la función $\log k(\cdot)$ dentro de la expectativa.
¿Estoy entendiendo mal la aplicación de la desigualdad de Jensen?