Gracias por aclarar tu pregunta. Voy a asumir que usted está usando $f$ a referirse a la función denotada por $u$ en el papel de enlace.
En primer lugar, permítanme comentar que no voy a poner demasiado stock en ese papel. Se va a un gran esfuerzo sólo para derivar el conocido lineal difuminado Gaussiano de convolución para la reducción de ruido. La difusión del enfoque sólo agrega valor si consideramos la difusión anisotrópica; mientras usted se pega con el enfoque lineal utilizado en ese papel, usted puede ser que también acaba de hacer difuminado Gaussiano y olvidarse de toda la difusión aspecto.
Usted parece ser el pensamiento de un proceso iterativo de gradiente de descenso esquema, en el que algunos paso a $\delta t$ es elegido, y la solución es modificado por la adición de un correspondiente múltiples de la gradiente. Esto no es lo que está sucediendo en este papel, no es $\delta t$ en el papel; por el contrario, el documento considera un continuo flujo donde en cada punto del flujo en la dirección del gradiente. Una discreta $\delta t$ que tendría que ser elegida sería sólo entrar en esto, si usted fuera a tratar de calcular el flujo numéricamente por la discretización. Esto no se hace en el papel; por el contrario, el papel resuelve la ecuación de flujo de calor analíticamente y deriva el difuminado Gaussiano de convolución de ella, con el ancho de la difuminado Gaussiano núcleo de aumentar con el tiempo $t$.
Yo interpreto la otra parte de su pregunta ¿por qué la expresión igualada a cero en el de Euler-Lagrange las ecuaciones es como un degradado. De Euler-Lagrange las ecuaciones se derivan de la variación de la función de $u$, el cálculo de la variación resultante de la función objetivo $E$ y el ajuste a cero. La expresión que se establece en cero, es la variación de $E$ con respecto al $u$ en cada punto. Usted puede pensar en esto en analogía a una función de varias variables, donde la pendiente se obtiene teniendo en cuenta la variación de la función en virtud de la variación de cada una de las variables. Cada valor de la función de $u$ en un punto es como una variable; la diferencia es que el $u$ se define en una cantidad no numerable de puntos, mientras que una función de varias variables sólo tiene un número finito de variables. El papel parece a equívocos algo sobre si $u$ está definido en un conjunto o en las píxeles; si consideran que se definen en los píxeles, a continuación, cada uno de sus valores en uno de los píxeles que sería una de las variables, y el gradiente de $u$ sería la colección de las variaciones de $u$ con respecto a cada una de estas variables, y esto es lo que la expresión de Euler-Lagrange las ecuaciones representa.
No podría ser más que explicar, pero voy a parar aquí y a ver si esto tiene sentido para usted, o si me voy en un camino equivocado.