5 votos

Conjuntos de nivel de funciones convexas

Deje $f:\mathbb{R}^2\rightarrow\mathbb{R}$ ser una función convexa. Para $t\in\mathbb{R}$, considerar el nivel correspondiente al conjunto de $$f^{-1}\{t\}=\{(x,y)\in\mathbb{R}^2: f(x,y)=t\}.$$

Para la aplicación que tengo en mente, por lo que será suficiente para asumir que todos los conjuntos de nivel de $f$ son compactos curvas. En ese caso, lo que denota la longitud del arco de la medida en el avión por $\ell(\cdot)$, cuando se hace una estimación de la forma $$\Big|\ell(f^{-1}\{t\})-\ell(f^{-1}\{t'\})\Big|\leq C |t-t'|^{\delta}$$ mantenga pulsado para algunos $C<\infty$$\delta>0$? Y ¿cómo funciona el óptimo exponente $\delta$ dependen de la $f$?

La intuición es que las curvas de $f^{-1}\{t\}$ $f^{-1}\{t'\}$ debe ser "cerca uno del otro" siempre $t$ está cerca de a $t'$. En qué otras maneras puede ser esto de manera rigurosa?

Gracias.

2voto

CodingBytes Puntos 102

Aquí es un enfoque en términos de "intuitiva de cálculo":

Vamos $$\gamma_v:\quad s\mapsto z(s)=\bigl(x(s),y(s)\bigr)\qquad(0\leq s\leq L_v)$$ ser la parametrización por longitud de arco de las $f^{-1}(v)$. Para cada una de las $s$ el vector tangente $\dot\gamma_v(s)$ es ortogonal a la gradiente $\nabla f$$z(s)$. Si nos orientamos $\gamma_v$ tal que $\nabla f$ puntos para el exterior, por lo tanto, podemos escribir $\nabla f\bigl(z(s)\bigr)$ en la forma $$\nabla f\bigl(z(s)\bigr)=\rho\bigl(z(s)\bigr)\bigl(\dot y(s),-\dot x(s)\bigr)\ ,\qquad\rho(z):=\bigl|\nabla f(z)\bigr|\ .$$ Para un infinitesimal $\epsilon>0$ el nivel de $\gamma_{v+\epsilon}:=f^{-1}(v+\epsilon)$ tiene la parametrización $$\gamma_{v+\epsilon}:\quad s\mapsto\Bigl(x(s)+\epsilon{ \dot y(s)\over\rho(z(s))},\ y(s)-\epsilon{ \dot x(s)\over\rho(z(s))}\Bigr)\qquad(0\leq s\leq L_v)\ ,$$ donde hemos dejado de lado los términos de orden superior en $\epsilon$. Así tenemos $$\dot\gamma_{v+\epsilon}(s)\doteq \Bigl(\dot x(s)+\epsilon{ \ddot y\rho-\dot y\dot\rho\over\rho^2},\ \dot y(s)-\epsilon{ \ddot x\rho-\dot x\dot\rho\over\rho^2}\Bigr)$$ y por lo tanto $$\bigl|\dot\gamma_{v+\epsilon}\bigr|\doteq1+2\epsilon{\dot x\ddot y-\ddot x\dot y\over\rho}$$ o $$\bigl|\dot\gamma_{v+\epsilon}(s)\bigr|\doteq 1+\epsilon{\kappa(s)\over\rho(z(s))}\ ,$$ donde hemos denotado la curvatura de $\gamma_v$$\kappa$. De esto podemos deducir la siguiente fórmula para la derivada de $L_v$ con respecto al $v$: $${dL_v\over dv}=\int_0^{L_v}{\kappa(s)\over\bigl|\nabla f(z(s))\bigr|}\ ds\ .\qquad(*)$$ Ahora que tenemos esta fórmula parece intuitivamente obvio: Cuando dejamos $v$ de aumento, a continuación, la longitud de la $L_v$ aumenta más en las partes de $\gamma_v$ donde la curvatura es grande, y no cambia a lo largo de las partes rectas de $\gamma_v$.

El integrando en la fórmula $(*)$ puede ser expresada en términos de las derivadas parciales de $f$. Se obtiene (véase, por ejemplo, Bronstein-Semendjajew) $${dL_v\over dv}=\int_0^{L_v}{f_{xx}f_y^2-2f_{xy}f_xf_y+f_{yy}f_x^2\over (f_x^2+f_y^2)^4}\Biggr|_{z(s)}\ ds\ .$$

0voto

clintp Puntos 5127

Lo que sigue es el trabajo que he hecho hacia una solución, que es por desgracia demasiado grande para un comentario. No puedo hacer ninguna garantía de que no va a ninguna parte.

Asumiré $f$ $C^1$ y estrictamente convexa. Suponiendo que el nivel de los conjuntos son compactos curvas, que también debe ser simple, ya que una función convexa tiene al menos un extremo local. Considerar los valores de $t$ en algunos vecindario $U$ $t_0$ (la que vamos a hacer tan pequeño como sea necesario). Deje $\gamma_t:[0,1]\to \mathbb R^2$ ser una parametrización de $f^{-1}\{t\}$ y tenga en cuenta que $\gamma_t$ a nivel local es la gráfica de una $C^1$ función de $(t,x)$ o $(t,y)$ fijos $t$. Gracias a la compacidad y varios teoremas de cálculo, tenemos un conjunto finito de $a_i,b_i\in [0,1]$ $C^1$ funciones $$\begin{align} f_{1}&:U\times (a_1,b_1)\to \mathbb R,\\ &\vdots\\ f_{n}&:U\times (a_n,b_n)\to \mathbb R\\ f_{n+1}&:U\times (a_{n+1},b_{n+1})\to \mathbb R\\ &\vdots\\ f_{n+m}&:U\times (a_{n+m},b_{n+m})\to \mathbb R \end{align}$$ de tal manera que cada $a_i<b_i$, la colección de $(a_i,b_i)$ cubre $(0,1)$, y no existe $C^1$ funciones $x_i,y_i$, que es estrictamente creciente en a $s$ tal que $$t\in U s\(a_i,b_i)\implica \gamma_t(s)=\begin{cases} (x_i(t,s),f_i(t,x_i(t,s))) &\text{if } 1\leq i\leq n\\ (f_i(t,y_i(t,s)),y_i(t,s)) &\text{if } n<i\leq n+m \end{casos}$$ Para los métodos de representación de la conveniencia, asumir $$0=a_1< a_2< b_1<a_3<b_2<a_4<b_3<\cdots < b_{n+m}=1$$ es decir, que los intervalos están en orden, muy bien recortado y no redundantes, que nos salva de tener que a través de/recorte de intervalos y reorganizar basura. Además, podemos suponer que las $x_i,y_i$ son afín funciones en $s$, al menos en lo que su dominio no se superpone con la de $x_j,y_j$$j>i$, por la elección de un adecuado parametrización para $\gamma_t$ (parametrización por longitud de arco es independiente). Deje $L(t)=\ell(f^{-1}\{t\})$$a_{n+m+1}=b_{n+m}=1$. Tenga en cuenta que $$\begin{align} L(t)=\ell(\mathrm{im}(\gamma_t)) &= \int_0^1\left\|\frac{d\gamma_t}{ds}\right\|ds\\ &=\sum_{i=1}^{n}\int_{a_i}^{a_{i+1}} \frac{dx_i}{ds}\sqrt{1+\left(\frac{df_i}{dx_i}\right)^2}ds+\sum_{i=n+1}^{n+m}\int_{a_i}^{a_{i+1}} \frac{dy_i}{ds}\sqrt{\left(\frac{df_i}{dy_i}\right)^2+1}ds \end{align}$$ así $$\begin{align} \frac{dL}{dt} &= \frac{d}{dt}\left(\sum_{i=1}^{n}\int_{a_i}^{a_{i+1}} \frac{dx_i}{ds}\sqrt{1+\left(\frac{df_i}{dx_i}\right)^2}ds+\sum_{i=n+1}^{n+m}\int_{a_i}^{a_{i+1}} \frac{dy_i}{ds}\sqrt{\left(\frac{df_i}{dy_i}\right)^2+1}ds\right)\\ &= \sum_{i=1}^{n}\int_{a_i}^{a_{i+1}} \frac{d}{dt}\left(\frac{dx_i}{ds}\sqrt{1+\left(\frac{df_i}{dx_i}\right)^2}\right)ds+\sum_{i=n+1}^{n+m}\int_{a_i}^{a_{i+1}} \frac{d}{dt}\left(\frac{dy_i}{ds}\sqrt{\left(\frac{df_i}{dy_i}\right)^2+1}\right)ds \end{align}$$ que podemos analizar, pieza por pieza. Mirando el primer integrando, tenga en cuenta que $x_i$ es afín en $s$ en la región nos preocupamos de lo $\frac{dx_i}{ds}$ positivo $C^1$ función de $c(t)$. Así tenemos $$\begin{align} \frac{d}{dt}\left(\frac{dx_i}{ds}\sqrt{1+\left(\frac{df_i}{dx_i}\right)^2}\right) &= \frac{d^2x_i}{ds dt}\sqrt{1+\left(\frac{df_i}{dx_i}\right)^2}+\frac{dx_i}{ds}\frac{df_i}{dx_i}\frac{d^2f_i}{dx_i dt}\left(1+\left(\frac{df_i}{dx_i}\right)^2\right)^{-1/2}\\ &= \frac{dc}{dt}\sqrt{1+\left(\frac{df_i}{dx_i}\right)^2}+c(t)\frac{df_i}{dx_i}\frac{d^2f_i}{dx_i dt}\left(1+\left(\frac{df_i}{dx_i}\right)^2\right)^{-1/2}\\ \end{align}$$ que tal vez podemos ordenar de entender. Además, desde la región contenida en $f^{-1}\{t\}$ es la intersección de un conjunto convexo con un plano, es convexa como bien lo $f_i$ (que define parte de su perímetro) es cóncava como una función de la $x_i$ $\frac{df_i}{dx_i}$ está disminuyendo. Podemos volver atrás y cambiar algo de lo que hicimos antes, moviéndose alrededor de nuestras opciones de $f_i$ para evitar los puntos de la curva tangente a los ejes, lo que significa que se pierda un conjunto de puntos de medida $0$ (que no afecta a la integral) lo $\frac{df_i}{dx_i}$ tendrá constante signo $\sigma_i$, pero esto podría causar algunos problemas. A partir de aquí, el mejor enfoque es probablemente para tratar de entender cada uno de los derivados. Los más difíciles son aquellos con respecto a $t$.

0voto

Matthew Scouten Puntos 2518

Supongamos $f$ es estrictamente convexa y tiene su mínimo en el origen. Podemos usar coordenadas polares $(r,\theta)$, en la que el elemento de longitud es $ds = \sqrt{dr^2 + r^2 d\theta^2}$. Ahora a lo largo de la curva de nivel, $\dfrac{dr}{d\theta} = - \dfrac{f_\theta}{f_r}$ (donde los subíndices se refieren a derivadas parciales wrt $r$$\theta$). La curva de nivel $f(r,\theta) = t$ puede ser escrito como $r = R(t,\theta)$, y su longitud es de $$ L = \int_0^{2\pi} \sqrt{\dfrac{f_\theta^2}{f_r^2} + r^2} \ d\theta = \int_0^{2\pi} \sqrt{\dfrac{f_\theta^2(R(t,\theta),\theta)}{f_r^2(R(t,\theta),\theta)} + R(t,\theta)^2}\ d\theta$$ Nos gustaría diferenciar el integrando con respecto a $t$ fijos $\theta$. Tenga en cuenta que $$\dfrac{\partial r}{\partial t} = \dfrac{1}{f_r}$$ Llego $$ \dfrac{\partial}{\partial t} \sqrt{\dfrac{f_\theta^2}{f_r^2} + r^2} = \frac{1}{f_r} \dfrac{\partial }{\partial r} \sqrt{\dfrac{f_\theta^2}{f_r^2} + r^2} = \left({f_\theta^2}+ r^2 f_r^2\right)^{-1/2} \left( \dfrac{f_\theta}{f_r^2} f_{r\theta} - \dfrac{f_\theta^2}{f_r^3} f_{rr} + r \right) $$ y por lo tanto debemos tener $$ \dfrac{dL}{dt} = \int_0^{2\pi} \left({f_\theta^2}+ r^2 f_r^2\right)^{-1/2} \left( \dfrac{f_\theta}{f_r^2} f_{r\theta} - \dfrac{f_\theta^2}{f_r^3} f_{rr} + r \right)\ d\theta$$ No sé si es posible conseguir útil de los límites de esta, pero quizás es un comienzo.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X