Estoy un poco desconcertado por el uso del método de descenso de gradiente. Mi duda es que el descenso de gradiente es un método iterativo para encontrar los mínimos/máximos de un paisaje de costes. Y utiliza el método de ascenso/descenso más pronunciado. Pero por otro lado estableciendo mi vector gradiente igual al vector cero debería haber obtenido mi punto óptimo. Entonces, ¿por qué utilizar el descenso de gradiente?
Respuesta
¿Demasiados anuncios?estableciendo mi vector de gradiente igual al vector cero debería haber obtenido mi punto óptimo.
Más precisamente: establecer el vector de gradiente igual al vector cero y resolviendo esta ecuación encontrarías un punto crítico.
Una ecuación entre vectores en 2 dimensiones es en realidad un sistema de 2 ecuaciones. Éstas son, en general, no lineales (a menos que su paisaje resulte ser un polinomio de segundo grado, cosa que dudo). Resolver algo así con manipulaciones algebraicas es poco probable. Uno tendría que utilizar algún método numérico para la solución, que probablemente va a ser iterativo en sí.
Además, igualar el gradiente a cero podría dar un máximo o un punto de silla. Es más probable que el descenso del gradiente se acerque a un mínimo, aunque a veces puede ser engañado por un punto de silla. Todavía queda el problema de averiguar si el mínimo encontrado es global... pero esto es un problema para todos los métodos.