1 votos

Criterios de parada del descenso gradual

Uno de los criterios para detener el descenso de gradiente es utilizar $reltol$ - detener el descenso de gradiente cuando la mejora cae por debajo de un umbral.

En la práctica, ¿hay alguna diferencia entre parar cuando la mejora empírica se acerca a cero y parar cuando $|\nabla f(x)|$ se acerca a cero?

2voto

Durden Puntos 6

El criterio de gradiente $$||\nabla f(x_{k})|| \leq \epsilon$$ es sensible a la escala, es decir, importa en qué unidades se miden los datos (por ejemplo, metro o kilómetro). En principio, tanto $x$ y su gradiente puede hacerse arbitrariamente grande o pequeño ajustando la unidad de medida. Por otro lado, el criterio de cambio de parámetro relativo $$|| x_{k} - x_{k-1} || \leq \epsilon$$ es invariante de la escala. Hay que tener en cuenta, sin embargo, que como $x_{k}$ es (probablemente) un vector, cada uno de sus elementos se trata igual aquí. Lo ideal sería ponderar cada parámetro con alguna información de curvatura, es decir, la matriz hessiana $\nabla^{2} f(x_{k})$ pero eso no suele ser factible desde el punto de vista computacional. Para un análisis más detallado de los criterios de parada, consulte las páginas 305-312 de Gill, Murray & Wright .

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X