6 votos

Comprender el transporte óptimo en una dimensión.

Estoy tratando de entender estas notas de clase. https://sites.ualberta.ca/~mathirl/IUSEP/IUSEP_2018/lecture_notes/Pass1.pdf Entiendo la formulación del Problema de Monge. Sin embargo, tengo problemas para entender el transporte óptimo unidimensional con la función de coste siendo $c(x-y)^2$ En particular, no entiendo muy bien esta diapositiva de la conferencia. enter image description here

En particular, no entiendo por qué la solución debe satisfacer $c(x_o,T(x_0))+c(x_1,T(x_1)) \leq c(x_0,T(x_1))+c(x_1,T(x_0))$ .

Además, no entiendo muy bien por qué esto implica que si $x_1>x_0$ entonces $T(x_1) \geq T(x_0)$ . (Lo entiendo haciendo algunos ejemplos concretos, pero no entiendo cómo la condición $c(x_o,T(x_0))+c(x_1,T(x_1)) \leq c(x_0,T(x_1))+c(x_1,T(x_0))$ significa que $T$ es monótona creciente).

Por último, no entiendo por qué debemos elegir T(x) de forma que $\int_{-\infty}^{x} f(t) dt= \int_{-\infty}^{T(x)} g(s) ds$ . Muchas gracias y perdón por las preguntas básicas.

3voto

Edmund Tay Puntos 712

1) Independientemente de cualquier suposición sobre $c$ si para algunos $x_0$ et $x_1$ tuvimos $c(x_0,T(x_0))+c(x_1,T(x_1)) > c(x_0,T(x_1))+c(x_1,T(x_0))$ (lo contrario de la desigualdad que afirmamos) entonces afirmo (ver más abajo) que se podrían intercambiar los destinos de un trocito de masa transportado desde cerca de $x_0$ et $x_1$ que es enviar el de alrededor de $x_0$ a cerca de $T(x_1)$ y viceversa. La desigualdad garantizaría entonces que esta permuta se tradujera en un menor coste global. Por lo tanto, para el plan de transporte óptimo nunca tenemos $c(x_0,T(x_0))+c(x_1,T(x_1)) > c(x_0,T(x_1))+c(x_1,T(x_0))$ es decir, siempre tenemos $c(x_0,T(x_0))+c(x_1,T(x_1)) \leq c(x_0,T(x_1))+c(x_1,T(x_0))$ .

La afirmación es más clara para una configuración discreta. Es decir, supongamos que en lugar de arena, hay que mover $N$ guijarros (de idéntica masa) situados en $x_1\leq x_2 \leq \ldots \leq x_N$ a nuevos lugares $y_1\leq y_2 \leq \ldots \leq y_N$ es decir, el mapa $x_i$ a $T(x_i)=y_{\sigma(i)}$ para alguna permutación $\sigma$ , mientras que minimizando la función de coste $\sum_i c(x_i, T(x_i))$ . Entonces, si su actual $T$ (es decir, su permutación actual $\sigma$ ) tenía la propiedad de que para algunos $i$ et $j$ que tenías $c(x_i,T(x_i))+c(x_j,T(x_j)) > c(x_i,T(x_j))+c(x_j,T(x_i))$ entonces podría cambiar $T$ intercambiando donde envía los dos guijarros $x_i$ et $x_j$ (postmultiplicando $\sigma$ por transposición $(i,j)$ ), sustituyendo literalmente los dos términos $c(x_i,T(x_i))+c(x_j,T(x_j))$ en la suma de la función de costes por los dos términos $c(x_i,T(x_j))+c(x_j,T(x_i))$ , consiguiendo así un plan de transporte menos costoso.

Para la situación no discreta, esto es un poco más sutil: las condiciones dadas en las diapositivas no se ven afectadas por el cambio de $T$ en el conjunto de medida cero, por lo que realmente no podemos afirmar nada sobre los valores individuales. Por otro lado, (una versión más cuidadosa de) el argumento anterior (con estimaciones) sí se cumple si suponemos $T$ sea continua a trozos, ignorar los valores en los puntos de discontinuidad y, por ejemplo, suponer $f$ es continua en un conjunto abierto $X$ .

Probablemente haya algo más hábil y general, pero a falta de eso, aquí hay un argumento: Supongamos que $c(x_0,T(x_0))+c(x_1,T(x_1)) > c(x_0,T(x_1))+c(x_1,T(x_0))$ para alguna pieza continua $T$ et $x_0$ et $x_1$ son puntos en los que $T$ es continua.

Afirmación 1: Entonces existe $\delta x_0 >0$ et $\delta x_1>0$ tal que $\int_{x_0}^{x_0+ \delta x_0} f(x) dx= \int_{x_1}^{x_1+ \delta x_1} f(x) dx$ et $c(x^+_0,T(x^+_0))+c(x^+_1,T(x^+_1)) > c(x^+_0,T(x^+_1))+c(x_1,T(x^+_0))$ para todos $x^+_0\in [x_0, x_0+\delta x_0], x^+_1\in [x_1, x_1+\delta x_1] $ ( estos son los "trozos de masa cerca $x_0$ et $x_1$ " que vamos a intercambiar; la prueba de la afirmación está más abajo).

Esta afirmación dice básicamente que $\hat{X}=[x_0,x_0+\delta x_0] \cup [x_1,x_1+\delta x_1]$ es un subdominio de $X$ en el que el plan de transporte es subóptimo. Esto implica que el plan de transporte es subóptimo en todos los $X$ . A saber, definir el nuevo $\hat{T}$ que es igual a la antigua $T$ en el exterior $\hat{X}$ y en $\hat{X}$ envía el $[x_0,x_0+\delta x_0]$ a donde $T$ utilizado para enviar $[x_1,x_1+\delta x_1]$ y viceversa: definir la monotonía $\phi:[x_0, x_0+\delta x_0]\to [x_1, x_1+\delta x_1]$ por $\int_{x_0}^{x} f(x)dx=\int_{x_1}^{\phi(x)} f(x)dx$ y su inversa (monótona) $\psi:[x_1, x_1+\delta x_1]\to [x_0, x_0+\delta x_0]$ por $\int_{x_1}^{x} f(x)dx=\int_{x_1}^{\psi(x)} f(x)dx$ (esto es el intercambio de los dos trozos de arena), y que $\hat{T}(x)=T(\phi(x))$ si $[x_0, x_0+\delta x_0]$ et $\hat{T}(x)=T(\psi(x))$ si $[x_1, x_1+\delta x_1]$ ("enviar los bits intercambiados a donde iba el original"). Las definiciones de $\phi$ et $\psi$ son tales que $\hat{T}$ es un mapa de transporte, y la desigualdad de la afirmación 1 significa que $\int_{\hat{X}} c(t, \hat{T}(t)) dt < \int_{\hat{X}} c(t, T(t))$ . (El mapa $\hat{T}$ también es continua a trozos). Así, hemos demostrado que si $T$ fuera un mapa de transporte óptimo y continuo a trozos, entonces debemos tener en realidad $c(x_0,T(x_0))+c(x_1,T(x_1)) \leq c(x_0,T(x_1))+c(x_1,T(x_0))$ al menos para todos los puntos $x_0, x_1$ donde $T$ es continua.

Prueba de la afirmación 1: Sea $I(t, s)=\int_{x_0}^{x_0+ t} f(x) dx -\int_{x_1}^{x_1+ s} f(x) dx$ . Entonces $I$ es continua cerca de $(0,0)$ (en una bola de tamaño $\varepsilon_1$ ), y para $a< \varepsilon_2$ tenemos $I(0,a)<0$ et $I(a, 0)>0$ . Queremos demostrar que para cualquier $\varepsilon>0$ hay positivos $s$ , $t$ con $|s,t|<\varepsilon$ con $I(s,t)=0$ . Toma un camino desde $(0, a)$ a $(0, a)$ dentro del cuadrante positivo de $\min(\varepsilon, \varepsilon_1, \varepsilon_2)$ . Entonces el valor de $I$ a lo largo de la trayectoria va de positivo a negativo, por lo que por continuidad debe ser cero en alguna parte, por lo que proporcionando el pequeño positivo $(s, t)$ con $I(s,t)=0$ que queremos.

Ahora, para terminar la prueba de la afirmación, sólo tenemos que observar que $ C(u,v)=c(x_0+u,T(x_0+u))+c(x_1+v,T(x_1+v))-c(x_0+u,T(x_1+v))+c(x_1+v,T(x_0+u))$ es continua cerca de $(0,0)$ por lo que si es positivo en $(0,0)$ es positivo para todos $(u,v)$ lo suficientemente pequeño, digamos $u<\varepsilon$ , $v<\varepsilon$ y podemos elegir $t=\delta x_0<\varepsilon$ et $s=\delta x_1<\varepsilon$ para garantizarlo.

2) Ahora, para una función $c$ con $\frac{\partial^2 c}{\partial x \partial y}<0$ la desigualdad $c(x,y)+c(x+\delta x, y+\delta y)< c(x, y+\delta y)+c(x+\delta x, y)$ es verdadera precisamente cuando $\delta x$ et $\delta y$ son del mismo signo. Explicaré por qué esto es cierto justo a continuación, pero asumiendo esto, concluimos precisamente que $\delta x=x_1-x_0$ et $\delta y=T(x_1)-T(x_0)$ deben ser del mismo signo, es decir, que $T$ es monótona.

El motivo es que $\frac{\partial^2 c}{\partial x \partial y}<0$ es la versión infinitesimal de la desigualdad $c(x,y)+c(x+\delta x, y+\delta y)< c(x, y+\delta y)+c(x+\delta x, y)$ -- si $\delta x$ et $\delta y$ son pequeñas, basta con que Taylor expanda los dos lados de esta última desigualdad a segundo orden. Sin embargo, necesitamos la implicación en el otro sentido, desde la versión infenitesimal $\frac{\partial^2 c}{\partial x \partial y}<0$ a la "global". Esto se puede visualizar rompiendo el rectángulo con vértices $(x,y)$ , $(x+\delta x, y+\delta y)$ , $(x, y+\delta y)$ et $(x+\delta x, y)$ en muchos rectángulos pequeños y aplicando la versión infinitesimal a cada trozo pequeño. Pero, por supuesto, uno quiere ser riguroso, así que aplica el teorema de Green a la integral de línea del campo vectorial $(-\frac{\partial c}{\partial x}, \frac{\partial c}{\partial y})$ (o a $(-\frac{\partial c}{\partial x}, 0)$ o a $(0, \frac{\partial c}{\partial y} )$ -- a tu elección) alrededor del límite del rectángulo. La condición sobre $\delta x$ et $\delta y$ asegura que las orientaciones en el teorema de Green funcionan de forma correcta.

3) Esto es sólo la "restricción de transporte" de la diapositiva 9, es decir $\int_{T^{−1}(A)} f(x)dx =\int_A g(y)dy$ aplicada al caso de la monotonía $T$ : dejar $A=(-\infty, T(x)]$ entonces $T^{-1}(A)=(-\infty, x]$ Ahora conéctate.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X