¿Cuál es la diferencia entre el descenso por gradiente proyectado y el descenso por gradiente ordinario?

Question

¿Cuál es la diferencia entre el descenso por gradiente proyectado y el descenso por gradiente ordinario?

Preguntado el 17 de Noviembre, 2013: Cuando se hizo la pregunta
39288 visitas: Cuantas visitas ha tenido la pregunta
2 Respuestas: Cuantas respuestas ha tenido la pregunta
Resuelta: Estado actual de la pregunta

Acabo de leer sobre el descenso de gradiente proyectado pero no vi la intuición para usar el proyectado en lugar del descenso de gradiente normal. ¿Podrías decirme la razón y las situaciones preferibles del descenso de gradiente proyectado? ¿Qué aporta esa proyección?

Preguntado el 17 de Noviembre, 2013 por Frances Williams

Answer 1

2 Respuestas

Answer 2

119voto

p.s. Puntos 2897

A un nivel básico, el descenso de gradiente proyectado no es más que un método más general para resolver un problema más general.

El descenso gradiente minimiza una función moviéndose en la dirección negativa del gradiente en cada paso. No existe ninguna restricción sobre la variable. $$ \text{Problem 1:} \min_x f(x) $$ $$ x_{k+1} = x_k - t_k \nabla f(x_k) $$

Por otro lado, el descenso de gradiente proyectado minimiza una función sujeta a una restricción. En cada paso nos movemos en la dirección del gradiente negativo, y luego "proyectamos" sobre el conjunto factible.

$$ \text{Problem 2:} \min_x f(x) \text{ subject to } x \in C $$

$$ y_{k+1} = x_k - t_k \nabla f(x_k)\\ x_{k+1} = \text{arg} \min_{x \in C} \|y_{k+1}-x\| $$

Respondido el 19 de Noviembre, 2013 por p.s. (2897 Puntos )

Answer 3

12voto

wwehner Puntos 41

He encontrado dos enfoques para el algoritmo.

Enfoque 1:

$d_k = Pr(x_k-\nabla f(x_k)) - x_k$ dirección de búsqueda proyectada sobre el conjunto factible
$x_{k+1} = x_k + t_k d_k$

Enfoque 2: (Igual que la respuesta de p.s.)

$y_k = x_k - t_k \nabla f(x_k)$
$x_{k+1} = Pr(y_k)$ : Proyecto $y_k$ en un conjunto factible

donde $Pr$ es el operador de proyección.

He comprobado que el método 1 funciona de forma más fiable. El enfoque 2 no converge si el minimizador está en el borde del conjunto factible y ese borde es perpendicular al gradiente del objetivo. Por ejemplo, las direcciones de búsqueda rebotan alrededor del minimizador en el algoritmo 2.

Vea aquí la implementación en matlab https://github.com/wwehner/projgrad

Respondido el 11 de Agosto, 2020 por wwehner (41 Puntos )

¿Cuál es la diferencia entre el descenso por gradiente proyectado y el descenso por gradiente ordinario?

Respuestas

Preguntas Destacadas

Etiquetas mas usadas

i-Ciencias.com

Powered by:

¿Cuál es la diferencia entre el descenso por gradiente proyectado y el descenso por gradiente ordinario?

Respuestas

Preguntas relacionadas

Preguntas Destacadas

Etiquetas mas usadas

En nuestra red

i-Ciencias.com

Powered by: