24 votos

En las redes neuronales, ¿por qué usar métodos de gradiente en lugar de otras metaheurísticas?

En el entrenamiento de redes neuronales profundas y superficiales, ¿por qué se usan comúnmente métodos de gradiente (por ejemplo, descenso de gradiente, Nesterov, Newton-Raphson), a diferencia de otras metaheurísticas?

Por metaheurística me refiero a métodos como el recocido simulado, la optimización de colonias de hormigas, etc., que se desarrollaron para evitar quedarse atascados en un mínimo local.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X