13 votos

Definiciones equivalentes de convexidad para $f\in\mathcal C^1(\mathbb R^n)$

Me he dado cuenta de que hay muchas preguntas idénticas en este sitio relacionadas con definiciones equivalentes de convexidad, véase por ejemplo 668679 , 740938 , 318692 , 1717542 , 1761801 , 3019331 , 3047518 y podría haber más.

Así que quería crear una "gran lista" de definiciones equivalentes de funciones convexas, empezaré con algunas definiciones equivalentes y publicaré mis pruebas en mi respuesta más abajo. Siéntase libre de añadir cualquier otra definición equivalente. Esta pregunta puede servir entonces como un duplicado abstracto.

Reclamación. Dejemos que $n\in\mathbb N$ y $f\in\mathcal C^1(\mathbb R^n)$ . Entonces lo siguiente es equivalente:

  1. $f$ es convexo, es decir $f(\lambda x_1 + (1-\lambda x_2))\le\lambda f(x_1)+(1-\lambda)f(x_2)$ para todos $\lambda\in[0,1]$ y $x_1,x_2\in\mathbb R^n$ .
  2. Para todos $x,y\in\mathbb R^n$ , $\langle\nabla f(x)-\nabla f(y),x-y\rangle\geq0$ .
  3. Por cada $x,y\in\mathbb R^n$ , $f(y)\geq f(x)+\langle y-x,\nabla f(x)\rangle$ .

10voto

Prueba de la equivalencia de 1., 2. y 3.
1. $\implies$ 3. Dejemos que $f$ sea convexo. Entonces, por definición del gradiente, para cada $x,y\in\mathbb R^n$ , \begin{align} \langle y-x, \nabla f(x)\rangle &= \lim_{h\to0}\frac{f(x+h(y-x))-f(x)}{h}\\&=\lim_{h\to0}\frac{f((1-h)x+hy)-f(x)}{h}\\&=\lim_{h\to0, h>0}\frac{f((1-h)x+hy)-f(x)}{h} \\&\overset{\text{convexity}}\le \lim_{h\to0, h>0}\frac{hf(y)-hf(x)}h\\&=f(y)-f(x). \end{align}

3. $\implies$ 2. Por la hipótesis 3., tenemos, para cada $x,y\in\mathbb R^n$ , \begin{equation}\label1\tag1f(y)\geq f(x)+\langle y-x,\nabla f(x)\rangle\end{equation} pero también \begin{equation}\label2\tag2f(x)\geq f(y)+\langle x-y,\nabla f(y)\rangle.\end{equation}

\eqref {2} es equivalente a $$-f(y)+\langle y-x,\nabla f(y)\rangle\geq -f(x),$$ que se sumó a \eqref {1} produce $$\langle y-x,\nabla f(y)\rangle\geq\langle y-x,\nabla f(x)\rangle$$ y, por tanto, el resultado deseado.

2. $\implies$ 1. Supongamos que 2. es cierto y definamos $g:[0,1]\to\mathbb R$ , $g(t)\overset{\text{Def.}}=f(x+t (y-x))$ . Entonces $g$ es convexo ya que, para $t\in[0,1]$ , \begin{equation} g'(t)=\lim_{h\to0}\frac{f(t y +(1-t)x + h(y-x))- f(t y+(1-t)x)}{h} = \langle y-x, \nabla f(t y +(1-t)x)\rangle, \end{equation} de modo que, para $0\le t_1< t_2\le 1$ , \begin{align} g'(t_2)-g'(t_1)&=\langle y-x, \nabla f(x+t_2 (y-x)) -\nabla f(x+t_1(y-x))\rangle \\ &=\frac1{t_2-t_1}\langle (x+t_2 (y-x)) - (x+t_1(y-x)), \nabla f(x+t_2 (y-x)) -\nabla f(x+t_1(y-x))\rangle \\ &\geq 0, \end{align} por el supuesto 3.

Por lo tanto, $g'$ es creciente y por lo tanto $g$ es efectivamente convexo ( prueba ).

Así que tenemos $$g(\lambda)\le\lambda g(1)+(1-\lambda) g(0)$$ por cada $\lambda\in[0,1]$ que, por definición de $g$ es exactamente $$f((1-\lambda)x+\lambda y)\le(1-\lambda) f(x)+\lambda f(y).$$

$\square$

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X