Esta respuesta es sobre todo un intento de escribir una arbitraria parte de la teoría del cálculo variacional sobre la marcha, mientras que el aprendizaje. Las dos principales referencias de esta respuesta está basada en (1) Milnor, "Morse teoría" (parte III) (2) Oancea, "de la teoría de Morse, cerrado geodesics, y la homología de bucle libre de los espacios" (capítulo 2-3). Gracias a @MikeMiller para señalar a la segunda referencia que tiene los correspondientes teoremas y edificaciones para hacer gradiente de flujo de trabajo, y gracias a @0celo7 para dar una clara y concisa introducción a la teoría de los espacios de Sobolev que es esencial para la segunda mitad de la respuesta.
Supongamos $(M, g)$ es la de Riemann colector y $p, q$ dos puntos en $M$. Denotar por $\Omega_{p, q}M$ a ser el espacio de vías lisas $\gamma : [0, 1] \to M$ tal que $\gamma(0) = p$$\gamma(1) = q$. Esto debe ser pensado como un infinito de dimensiones múltiples; si $\gamma \in \Omega_{p, q}M$ es un punto, se puede definir el espacio de la tangente $T_\gamma \Omega_{p, q}M $ a ser el espacio de campos vectoriales $X$ a lo largo de $\gamma$ tal que $X(p) = X(q) = 0$.
La intuición es, si tenemos un campo vectorial $X$ a lo largo de un camino de $\gamma$$M$, que uno puede pedir para soluciones de $\alpha : (-\epsilon, \epsilon) \times [0, 1] \to M$ de la "ecuación variacional" dada por $$\dfrac{d}{ds}\alpha(0, t) = X(\gamma(t))$$ with the initial conditions $\alfa(s, 0) = p$ and $\alpha(s, 1) = p$ for all $s$ (this happens because $X$ is zero at the endpoints of $\gamma$) and $\alpha(0, t) = \gamma(t)$ for all $t$. Therefore $\gamma_s = \alpha(s, -)$ are simply variations of $\gamma$ for $s\neq 0$ obtained from "flowing a little to the sideways along $X$". There is always a unqiue such variation for any given vector field $X \in T_\gamma \Omega_{p, q}M$ por el Picard-Lindelof teorema.
Hay una función de $\mathcal{E} : \Omega_{p, q}M \to \Bbb R$ conocido como la "energía funcional", que se define por $$\mathcal{E}(\gamma) = \displaystyle \int_0^1 g(\gamma'(t), \gamma'(t))dt$$ (note that this is similar to the formula for arclength) The "first derivative" $d\mathcal{E}$ of this functional is $d\mathcal{E}(\gamma)(X) = d/ds\,\mathcal{E}(\gamma_s)|_{s=0}$ for any given $\gamma$ in $\Omega_{p, q}M$ and $X$ in $T_\gamma \Omega_{p, q}M$ where $\gamma_s(t) = \alpha(s, t)$ is the variation of $\gamma$ defined by $X$.
Teorema: Un camino de $\gamma$ $\Omega_{p, q}M$ es un punto crítico de la energía funcional (es decir, $d\mathcal{E}(\gamma)(X) = 0$ todos los $X$$T_\gamma \Omega_{p, q}M$) si y sólo si $\gamma$ es una geodésica de $M$
Prueba: Vamos a denotar $\partial_s$ a ser la derivada en la dirección de la $X$ $\partial_t$ a ser la derivada en la dirección de la $\gamma'$ para ser breves. Observe que $[\partial_t, \partial_s] = 0$. Mediante la diferenciación bajo el signo integral, $$\begin{align} d\mathcal{E}(\gamma)(X) = \int_0^1 \partial_s g(\partial_t \gamma_s(t), \partial_t \gamma_s(t))dt & = 2\int_0^1 g(\nabla_{\partial_s} \partial_t \gamma_s(t), \partial_t \gamma_s(t))dt \\ &= 2\int_0^1 g(\nabla_{\partial_t} \partial_s \gamma_s(t), \partial_t \gamma_s(t)) dt\\&= 2\int_\gamma g(\nabla_{\gamma'} X, \gamma') \end{align}$$ where we have used symmetry of the Levi-Civita connection to conclude $\nabla_{\partial_t} \partial_s = \nabla_{\partial_s} \partial_t$. Using integration by parts (and using $X(\gamma(0)) = X(\gamma(1)) = 0$), we conclude $$d\mathcal{E}(\gamma)(X) = - 2\int_\gamma g(X, \nabla_{\gamma'} \gamma')$$ This formula implies that $d\mathcal{E}(\gamma)(X) = 0$ if and only if $\nabla_{\gamma'} \gamma' = 0$ (i.e. $\gamma$ is a geodesic). $\blacksquare$
Recordar que si $f : M \to \Bbb R$ es una función suave en una de Riemann colector $(M, g)$, entonces el vector gradiente de campo $\text{grad} \, f$ está definido por $g(\text{grad}\, f, X) = X(f)$. Por Cauchy-Schwarz desigualdad, $g(\text{grad}\, f, X) \leq \|\text{grad}\, f\|_g \|X\|_g$ con igualdad de iff $\text{grad} \, f = c X$ para algunos escalares función de $c$. En otras palabras, la máxima dirección de ascenso para $f$ está dado por el gradiente. Por lo tanto, si uno mira el negativo del gradiente de flujo de $\phi : \Bbb R \to \text{Diffeo}(M)$ $\partial_t \phi = -\text{grad}\, f$ de las líneas de flujo $\{\phi_t(x_0)\}$ seguir la dirección de máximo descenso de $f$ (este algoritmo por lo tanto se conoce como el método de steepest descent). Si $\|\text{grad} \, f\|_g$ disminuye a lo largo de una cierta línea de flujo, se deben converger a un punto crítico de $f$.
Para aplicar ideas similares para encontrar los puntos críticos de $\mathcal{E}$, actualizamos $\Omega_{p, q}M$ a un espacio más grande $\widetilde{\Omega_{p, q} M}$, que consta de $H^1$-rutas de $\gamma : [0, 1] \to M$ (es decir, $\|\gamma\|_{H^1} := (\int \|\gamma\|^2 + \|\gamma'\|^2)^{1/2} < \infty$ donde $M$ se realiza como un isométricamente incrustado submanifold de $\Bbb R^N$ por el Nash de incrustación y teorema de las normas son la distancia Euclídea normas) con extremos de $p$ y $q$. El espacio de la tangente $T_\gamma \widetilde{\Omega_{p, q} M}$ a un punto de $\gamma$ se define como el espacio de $H^1$-campos vectoriales a lo largo de $\gamma$, que es cero en los extremos como antes. La energía funcional $\mathcal{E}$ $C^1$- funcionales en $\widetilde{\Omega_{p, q} M}$ y la fórmula anterior para $d\mathcal{E}$ mantiene. Los puntos críticos de $d\mathcal{E}$ $H^1$- soluciones a $\nabla_{\gamma'} \gamma' = 0$, que es una elíptica de la PDE de una variable , por lo tanto, por elípticas regularidad $H^1$-soluciones son automáticamente $C^\infty$, por lo que son exactamente los geodesics en $M$. $\widetilde{\Omega_{p, q} M}$ tiene la estructura de un Hilbert colector de Riemann métrica inducida a partir de la $H^1$-producto interior $$\tilde{g}(X, Y) = \int_\gamma g(X, Y) + \int_\gamma g(\nabla_{\gamma'} X, \nabla_{\gamma'} Y)$$
Ahora podemos definir el gradiente $\text{grad}\, \mathcal{E}$, de modo que $\text{grad}\, \mathcal{E}(\gamma)$ es el único campo vectorial a lo largo de $\gamma$, de modo que $\tilde{g}(X, \text{grad}\, \mathcal{E}(\gamma)) = d\mathcal{E}(\gamma)(X)$ todos los $X \in T_\gamma \widetilde{\Omega_{p, q} M}$. Comparando esto con las fórmulas anteriores, $$\int_\gamma g(X, \text{grad}\, \mathcal{E}(\gamma)) + \int_\gamma g(\nabla_{\gamma'} X, \nabla_{\gamma'} \text{grad}\, \mathcal{E}(\gamma)) = -2\int_\gamma g(X, \nabla_{\gamma'} \gamma')$$ using integration by part on the middle integral along with $X|_{\parcial \gamma} = 0$ we derive $$\int_\gamma g(X, \text{grad}\, \mathcal{E}(\gamma)) - \int_\gamma g(X, \nabla^2_{\gamma'} \text{grad}\, \mathcal{E}(\gamma)) = -2\int_\gamma g(X, \nabla_{\gamma'} \gamma')$$ Which implies $\texto{grad}\, \mathcal{E}(\gamma)$ is the unique solution to the ODE $Y - \nabla_{\gamma'}^2 Y + 2 \nabla_{\gamma'} \gamma' = 0$ with initial condition $S|_{\parcial \gamma} = 0$ (or rather $S(p) = Y(q) = 0)$. This determines $\texto{grad}\, \mathcal{E}$ on every smooth path completely independently of the Hilbert manifold formalism of $\widetilde{\Omega_{p, q} M}$.
Teorema: La energía funcional $\mathcal{E} : \widetilde{\Omega_{p, q} M} \to \Bbb R$ satisface el Palais-Smale condición, es decir, si $(\gamma_k)$ es una secuencia de las rutas en las $\widetilde{\Omega_{p, q} M}$ tal que $(\mathcal{E}(\gamma_k))$ es limitado y $\|\text{grad}\, \mathcal{E}(\gamma_k)\|_{\tilde{g}} \to 0$, entonces cada punto límite $\gamma$ $(\gamma_k)$ es un punto crítico de $\mathcal{E}$, es decir, $d\mathcal{E}(\gamma)(X) = 0$ todos los $X$$T_\gamma \widetilde{\Omega_{p, q} M}$.
Por lo tanto, si $\gamma_s$ es una variación de $\gamma \in \widetilde{\Omega_{p, q} M}$ tal que $\partial_s \gamma_s = -\text{grad}\, \mathcal{E}(\gamma_s)$, es decir, $\gamma_s$ es una línea de flujo de la "negativa el flujo de gradiente en $\widetilde{\Omega_{p, q}}$" a partir de las $\gamma$, a continuación, en virtud de una elección adecuada de $\gamma$ que podemos esperar es $\gamma_s$ a converger a un punto crítico de $\mathcal{E}$ por el teorema anterior. Esto le da un algoritmo análogo a la mayor descenso para encontrar geodesics entre dos puntos de $p, q$ $M$ por fluye a lo largo de la negativa del gradiente en el espacio de las rutas.