16 votos

Convexidad de la diferencia de log-sum-exp: $f(x_1, x_2, x_3, x_4) = \log(e^{x_1} + e^{x_2}) - \log(e^{x_1} + e^{x_2} + e^{x_3} + e^{x_4})$

Me gustaría saber si la siguiente función $f: \mathbf{R}^4 \to \mathbf{R}$ es cóncavo o no:

$$ f(x_1, x_2, x_3, x_4) = \log(e^{x_1} + e^{x_2}) - \log(e^{x_1} + e^{x_2} + e^{x_3} + e^{x_4}) $$

He intentado comprobar si el hessiano era semidefinido negativo, pero no he conseguido nada. El hessiano se puede escribir como

$$ \nabla^2 f(x) = \frac{1}{\tilde{Z}^2}(\tilde{Z} \cdot \text{diag}(\tilde{\mathbf{z}}) - \tilde{\mathbf{z}}\tilde{\mathbf{z}}^\intercal) - \frac{1}{Z^2}(Z \cdot \text{diag}(\mathbf{z}) - \mathbf{z} \mathbf{z}^\intercal), $$

donde $$ \tilde{\mathbf{z}} = \begin{bmatrix} e^{x_1} & e^{x_2} & 0 & 0 \end{bmatrix}^\intercal \\ \mathbf{z} = \begin{bmatrix} e^{x_1} & e^{x_2} & e^{x_3} & e^{x_4} \end{bmatrix}^\intercal \\ \tilde{Z} = e^{x_1} + e^{x_2} \\ Z = e^{x_1} + e^{x_2} + e^{x_3} + e^{x_4} $$ pero no llegué mucho más lejos. Cualquier ayuda será muy apreciada.

Esta pregunta discute en detalle la convexidad de la función log-sum-exp, pero no se aplica a mi caso (diferencia de fcts).

3 votos

Fijación de $x_2=x_3=x_4=0$ obtenemos la función $\log(e^x+1)-\log(e^x+3)$ . Tomar la segunda derivada, simplificar, ver que cambia de signo.

2 votos

@Bookend, gracias, ¡eso es simple y claro! ¿Te gustaría escribir una respuesta adecuada para ello? Estaré encantado de aceptarla.

13 votos

@Bookend, hice una pregunta en meta sobre esto: meta.math.stackexchange.com/questions/23554 - Me encantaría que me explicaras por qué crees que es una mala pregunta.

7voto

lum Puntos 103

(Esta respuesta se basa en el primer comentario a la pregunta anterior).

Respuesta corta: no la función no es cóncava.

En lugar de analizar la totalidad de $4 \times 4$ hessian, podemos empezar por restringir nuestra atención a un subespacio de la entrada, por ejemplo, la línea inducida al establecer $x_2 = x_3 = x_4 = 0$ . En esta línea, la función original puede reescribirse como una función univariante $\tilde{f}(x) = \log(e^x + 1) - \log(e^x + 3)$ .

la segunda derivada de $\tilde{f}$ es $$ \frac{d^2\tilde{f}}{dx^2} = \frac{e^x(6 - 2 e^{2x})}{(e^x + 1)^2 (e^x + 3)^2} $$ es fácil ver que la segunda derivada es positiva para $x = 0$ Por lo tanto $\tilde{f}$ no es cóncava (además, es negativa para $x = 1$ por lo que tampoco es convexo). Concluimos que $f$ no es cóncava.

Nótese que el tipo de funciones aquí descritas (diferencia de log-sum-exps) aparece en la función de log-verosimilitud de ciertos modelos estadísticos de comparaciones pareadas, como Eliminación por aspectos y comparaciones de equipos .

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X