He estado utilizando la función de optimización de Nelder-Mead para obtener los valores óptimos de los pesos de la función de coste en casos sencillos de regresión lineal y logística, la ventaja de este algoritmo es que no requiere que el usuario suministre los gradientes de la función de coste con respecto a los pesos (se siente como una trampa).
Entonces, ¿hay alguna limitación o restricción para utilizar métodos de optimización como el de Nelder-Mead que no requieran el cálculo de gradientes?