11 votos

Convexidad e igualdad en la desigualdad de Jensen

El problema:

Recordemos que vimos que cuando $\mu$ es una medida de probabilidad sobre $X$ y $f$ es integrable con respecto a $\mu$ entonces $$ \exp\left(\int_X f(x)d\mu(x)\right) \leq \int_X e^{f(x)}d\mu(x).$$ ¿Qué se puede concluir si tenemos igualdad?

Sé que la solución son las funciones que son constantes en $X$ para todo excepto un conjunto de medida 0, pero no estoy muy seguro de cómo demostrar esto. Hasta ahora lo que he hecho es demostrar que una función constante sobre un conjunto de medida 1 en $X$ da la igualdad, pero no he podido encontrar una forma de mostrar una función con al menos dos valores distintos en subconjuntos de $X$ de medida positiva no puede dar la igualdad. A saber:

Si tenemos alguna función integrable (con respecto a $\mu$ ) que es constante en todo excepto en un conjunto de medida 0, digamos $f(x) = c$ para todos $x\in Y\subset X$ con $\mu(Y) = 1$ entonces el lado izquierdo es \begin {align*} \exp\left ( \int_X f(x)d \mu (x) \right ) &= \exp\left (c \int_X d \mu (x) \right ) \newline &= \exp\left (c \int_Y d \mu (x) \right ) \newline &= \exp (c \mu (Y)) \newline &= e^c. \end {align*} El lado derecho es \begin {align*} \int_X e^{f(x)}d \mu (x) &= \int_X e^c d \mu (x) \newline &= e^c \int_X d \mu (x) \newline &= e^c \int_Y d \mu (x) \newline &= e^c \mu (Y) \newline &= e^c, \end {align*} y así tenemos $$ \exp\left(\int_X f(x)d\mu(x)\right) = \int_X e^{f(x)}d\mu(x).$$ Estos son los únicos posibles $f$ para que se produzca la igualdad. Para ver esto, supongamos $f$ no eran constantes (en todos menos en un conjunto de medida 0). Empecemos por el caso más sencillo, es decir, supongamos $X = N\cup Y\cup Z$ con $N,Y$ y $Z$ disjuntos entre sí, $\mu(Y) > 0 < \mu(Z)$ y $\mu(N) = 0$ tal que $f(y) = a$ para todos $y\in Y$ y $f(z) = b$ para todos $z\in Z$ con $a\neq b$ .

Entonces el lado izquierdo es \begin {align*} \exp\left ( \int_X f(x)d \mu (x) \right ) &= \exp\left ( \int_Y a d \mu (x) + \int_Z b d \mu (x) \right ) \newline &= \exp\left (a \int_Y d \mu (x) + b \int_Z d \mu (x) \right ) \newline &= \exp (a \mu (Y) + b \mu (Z)). \end {align*} mientras que el lado derecho es \begin {align*} \int_X e^{f(x)}d \mu (x) &= \int_Y e^a d \mu (x) + \int_Z e^b d \mu (x) \newline &= e^a \int_Y d \mu (x) + e^b \int_Z d \mu (x) \newline &= e^a \mu (Y) + e^b \mu (Z). \end {align*}

Entonces... No estoy seguro de cómo mostrar $a\neq b$ implica $$ \exp(a\mu(Y) + b\mu(Z)) < e^a \mu(Y) + e^b \mu(Z).$$

Supongo que es algo sencillo que se me escapa, pero no veo muy bien cómo proceder.

Edición: Supongo que puedo añadir algunos de los chanchullos que he hecho.

Sabemos que $$\mu(Z) = 1 - \mu(Y),$$ por lo que la igualdad original se puede escribir como $$ \exp(a\mu(Y) + b(1-\mu(Y))) \leq e^a \mu(Y) + e^b (1-\mu(Y))$$ lo que significa $$ \exp((a-b)\mu(Y) + b) \leq (e^a - e^b)\mu(Y) + e^b.$$ Por lo tanto, como $$ \exp((a-b)\mu(Y) + b) = \exp((a-b)\mu(Y))e^b,$$ tenemos $$ \exp((a-b)\mu(Y)) \leq (e^{a-b} - 1)\mu(Y) + 1.$$

Edita un poco más:

Supongo que se podría considerar esta última desigualdad como una función de $a-b$ . Para hacer las cosas más ordenadas, sólo una función de $\exp(a-b)$ Así pues, dejemos que $x = \exp(a-b)$ . Entonces tenemos $$ x^{\mu(Y)} \leq (x - 1)\mu(Y) + 1.$$ Ahora sabemos si $a = b$ (es decir, $x = 1$ ) tenemos la igualdad, por lo que podemos calcular la derivada de ambos lados. La derivada del lado izquierdo es $$ \mu(Y)x^{\mu(Y) - 1},$$ mientras que la derivada del lado derecho es simplemente $\mu(Y)$ . Por lo tanto, como $x$ aumenta las funciones no puede ser nunca más igual.

Creo que esto funciona, aunque me sentaré a pensarlo un poco más (y su generalización a todas las funciones no constantes en $X$ )

5voto

freespace Puntos 9024

Su argumento no parece ser correcto. Usted escribió:

Para ver esto, supongamos $f$ no eran constantes (en todos menos en un conjunto de medida 0). En concreto, supongamos que $X = N\cup Y\cup Z$ con $N,Y$ y $Z$ disjuntos entre sí, $\mu(Y) > 0 < \mu(Z)$ y $\mu(N) = 0$ tal que $f(y) = a$ para todos $y\in Y$ y $f(z) = b$ para todos $z\in Z$ con $a\neq b$ .

Esto significaría que $f$ sólo tiene dos valores, $a$ y $b$ . Pero las funciones no constantes pueden tener muchos valores distintos, toma sólo $f(x)=x$ .

EDIT: Ver los comentarios del OP más abajo - parece que sólo entendí mal su estrategia de prueba.


Pista 1: Trabajar con la constante $c=\int_X f(x) \,\mathrm{d}\mu(x)$ . ¿Qué puede decir si asume que $\{x;f(x)\ne c\}$ tiene una medida distinta de cero?

Pista 2: Simplemente trata de recorrer la prueba de la desigualdad de Jensen y en el lugar donde la convexidad de $e^x$ se utiliza el hecho de que es estrictamente convexo.


Prueba: Supongamos que $$ \exp\left(\int_X f(x)d\mu(x)\right) = \int_X e^{f(x)}d\mu(x). \qquad (1)$$ Queremos demostrar que si la igualdad se mantiene entonces $f$ es constante.

Denotemos $c=\int_X f(x) \,\mathrm{d}\mu(x)$ . La desigualdad anterior puede reescribirse ahora como $e^c = \int_X e^{f(x)} \,\mathrm{d}\mu(x)$

Supongamos que $f$ no es constante, es decir $f(x)\ne c$ en un conjunto de medida positiva. Entonces ambos conjuntos $A=\{x; f(x)>c\}$ y $B=\{x; f(x)<c\}$ debe tener medida positiva. (De lo contrario, tendríamos una contradicción con la definición de $c$ como el valor medio de $f$ .)

Para cualquier $t\ne c$ tenemos $e^t>e^c+e^c(t-c)$ ya que el gráfico de $e^x$ se encuentra por encima de la línea tangente en el punto $c$ . (El factor $e^c$ es la pendiente en el punto $c$ .) Esto significa que $$e^t-e^c>e^c(t-c).$$

Así, para cualquier $x\in A\cup B$ tenemos una desigualdad estricta $e^{f(x)}-e^c>(f(x)-c)e^{c}$ . Para cualquier $x$ tenemos $e^{f(x)}-e^c \ge (f(x)-c)e^c$ . La integración da $$\int_X e^{f(x)} \,\mathrm{d}\mu(x) - e^c > e^c \left(\int_X f(x) \,\mathrm{d}\mu(x) -c \right) = 0,$$ contradiciendo la igualdad (1).

El mismo argumento sirve para cualquier función estrictamente convexa en lugar de $e^x$ Véase, por ejemplo, Lieb, Loss: Analysis, p.45 . (Quizá mi respuesta sería más clara y sencilla si trabajara con una función estrictamente convexa arbitraria. Debería haber pensado en esto antes...)

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X