4 votos

Cómo mostrar $f(z) = \sum_{j=1}^m \min_{\ell = 1, \cdots, q}\| x^j - z^\ell \|$ NO es convexa en a $\mathbb{R}^n \times \cdots \times \mathbb{R}^n$

Deje $n, m \in \mathbb{N}$, $q \geq 2$, e $x^j \in \mathbb{R}^n$ para $j=1, \cdots, m$.

¿Cómo podemos demostrar que la siguiente función $f$ es noconvexo? $$ f : \mathbb{R^{cn}} = \mathbb{R}^n \times \cdots \times \mathbb{R}^n \to \mathbb{R} \\ f(z) = f(z^1, \cdots, z^q) := \sum_{j=1}^m \min_{\ell = 1, \cdots, q}\| x^j - z^\ell \| = \left\| \begin{pmatrix} \min_{\ell = 1, \cdots, q} \| x^1 - z^\ell \| \\ \vdots \\ \min_{\ell = 1, \cdots, q} \| x^m - z^\ell \| \end{pmatrix} \right\|_1 $$


Mi trabajo/pensamientos hasta el momento:

  • El problema es el $\min$ funciones, ya $f$ sería convexa en $\mathbb{R}^{nq}$ si $\ell(j)$ ya eran conocidos (ya que acababa de tener una suma de funciones convexas).

  • He demostrado que $f$ no es complejo en virtud de cierta simplificación de las circunstancias. Es decir, si $x^j = 0$ para $j= 1, \cdots, m$ , y dejamos $n=1$, $q = 2$. Entonces podemos tomar $z := (6,8)^T$, $w := (4,2)^T$, e $\lambda := 1/2$, lo que produce $$ f(\lambda w + (1- \lambda) z) = 5m > 4m = \lambda f(w) + (1-\lambda) f(z). $$ Es decir, he mostrado (Suposiciones $\nRightarrow$ $f$ convexo). Pero ese no es el mismo como se muestra (Suposiciones $\Rightarrow$ $f$ NO convexo), que es el objetivo.

  • Además, el uso de la inversa de la desigualdad del triángulo, puedo demostrar que para todos los $\lambda \in (0,1)$, $z = (z^1, \cdots, z^q),w= (w^1, \cdots, w^q) \in \mathbb{R}^{nq}$ $$ f(\lambda z + (1-\lambda)w) \geq \lambda f(z) + (\lambda - 1) f(w) $$ Pero, también, no lo que yo quiero.

Procedencia de ejercicio:

  • Este problema se deja como ejercicio para el lector en un texto de optimización estoy leyendo (Grundzüge der Globalen Optimierung por Stein).
  • Es parte de una muestra permanente sobre la búsqueda de $q$ centros de cluster ( $z^j$, $j=1, \cdots, q$) entre una nube de datos (la $x^j$, $j=1, \cdots, m$). Aquí $f$ es una opción razonable para la función de destino que queremos minimizar.

2voto

tyson blader Puntos 18

Deje $Z\in\mathbb R^n$ ser un punto tal que $\|x^j-Z\|,\|x^j-2Z\|>\|x^j\|$ por cada $j,$ por ejemplo $Z=(1+2\max_j\|x^j\|,0,0,\dots,0).$ Luego

$$f(0,2Z,2Z,\dots,2Z)=\sum_{j=1}^m\|x^j\|$$ y $$f(2Z,0,0,\dots,0)=\sum_{j=1}^m\|x^j\|$$ pero $$f(Z,Z,Z,\dots,Z)>\sum_{j=1}^m\|x^j\|$$ lo que se contradice con el punto medio de la convexidad de $f.$

Llegué a este argumento al considerar primero el caso de que todos los $x^j$ son iguales, entonces la generalización.

0voto

richard Puntos 1

Ayer me volvió a perder la conexión a Internet, así que escribí mi respuesta fuera de línea y no veo Dap respuesta. Es un poco similar pero más simple, así que mi voto para el premio de él por la recompensa.

Su ejemplo se puede generalizar para el caso general. Es decir, tomar $M=1+\max_{j=1,\dots,m}\|x^j\| $ y poner $z:=2M(6,8,\dots,8)^T$, $w:=2M(4,2,\dots,2)^T$, e $\lambda=1/2$. A continuación, para cada una de las $j=1,\dots,m$ hemos

$$\min_{\ell=1,\dots, q}\|x^j-z^\ell\|\le \min_{\ell=1,\dots, q}\|x^j\|+\|z^\ell\|= \|x^j\|+\min_{\ell=1,\dots, q}\|z^\ell\|\le M-1+12M<13 M.$$

Por lo $f(z)<13Mm$. Del mismo modo $f(w)<5Mm$. Por lo $\lambda f(w)+(1−\lambda)f(z)<9Mm$. Por otro lado, si $v=\lambda w+(1−\lambda)z=2M(5,5,\dots,5)$ , a continuación, para cada una de las $j=1,\dots,m$ hemos

$$\min_{\ell=1,\dots, q}\|x^j-v^\ell\|\ge \min_{\ell=1,\dots, q}\|v^\ell\|-\|x^j\|= -\|x^j\|+\min_{\ell=1,\dots, q}\|v^\ell\|\ge 1-M+10M>9M.$$

Por lo $$f(\lambda w+(1−\lambda))=f(v)>9Mm>\lambda f(w)+(1−\lambda)f(z).$$

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X