Supongamos que tengo un conjunto de números generados aleatoriamente, donde cada número está indexado por $x$ . Esto equivale a un campo escalar 1-D, llamémoslo $u(x)$ .
Digamos que mi objetivo es minimizar la distancia entre cada par de escalares siguientes, lo que puede expresarse como la minimización del siguiente funcional de energía:
$$E[u(x)] = \sum_{x}\left(\frac{du(x)}{dx}\right)^2$$
Gracias al comentario/aclaración de @BrianBorchers, la configuración $u(x)=0$ acabaría alcanzando un mínimo no restringido. Así, introduzco las siguientes restricciones: $u(x)$ se define en $[a,b]$ para que $u(a)$ y $u(b)$ son valores escalares fijos.
Las primeras (o segundas) derivadas del campo escalar $u(x)$ se puede aproximar fácilmente tomando diferencias finitas. Me gustaría utilizar simplemente el descenso de gradiente para conseguir que el campo escalar u converja al estado deseado. Por lo tanto, necesito un paso de actualización para $u(x)$ Algo así como..:
$$u^{k+1} = u^{k} - \alpha\left(\frac{dE[u(x)]}{du(x)}\right)$$ , donde $\alpha$ es un paso/ritmo de actualización constante.
Lo hago para conocer a fondo un artículo de investigación que utiliza funciones de energía similares, aunque más complejas, expresadas en términos de un campo vectorial. Los autores afirman que el paso de actualización, es decir, el equivalente al término $\frac{dE[u(x)]}{du(x)}$ anterior se deriva utilizando las ecuaciones de Euler-Lagrange. A continuación se ofrecen enlaces al artículo y al material complementario.
He mirado numerosos tutoriales y algunos libros, y si entiendo bien, la ecuación de Euler-Lagrange para dicha energía $E[u(x)]$ sería:
$$-\frac{d}{dx}E_{u'}[u(x)] + E_{u}[u(x)] = 0$$ o, utilizando la notación de Lagrange para las derivadas, $$-\frac{d}{dx}\left(\frac{dE[u(x)]}{d\frac{du(x)}{dx}}\right) + \frac{dE[u(x)]}{du(x)} = 0$$
- ¿Es correcta la formulación anterior de la ecuación de Euler-Lagrange?
- La ecuación de Euler-Lagrange parece que sería directamente un punto estacionario en el funcional de energía. Supongo que no puedo hacerlo directamente por alguna razón. ¿Cómo funciona exactamente la ecuación de Euler-Lagrange con el paso de actualización que debo tomar en mi descenso de gradiente gradiente de arriba?
- ¿Cómo puedo formular exactamente el paso de actualización como un función de las derivadas primera y segunda de $u(x)$ por ejemplo $x$ ?
El artículo de investigación original (véase la sección 4.2) y el material complementario (véase la sección 2.3) :