Estoy aprendiendo sobre el multiplicador de Lagrange. Esto es lo que entiendo hasta ahora.
Supongamos un punto $P$ es un minimizador de $f(x)$ sujeto a $g(x)=0$ . Entonces cualquier movimiento a lo largo de esa curva de nivel de $g$ debe irse $f$ no se vería afectado, ya que de lo contrario (suponiendo que $f$ suave o algo así) habría algún punto más alto que ese en $P$ . Por tanto, la curva de nivel de $g$ debe ser perpendicular al gradiente de $f$ denotado $\nabla f$ .
Creo que el gradiente de $g$ es perpendicular a la curva de nivel de $g$ por una razón similar. Así que los gradientes de ambos $g$ y $f$ son perpendiculares a la curva de nivel de $g$ .
Por lo tanto, podemos expresar esta situación como
$$\nabla f(p) = -\lambda \nabla g(P)$$ con un signo menos convencional, y tenga en cuenta también que $$g(P) = 0.$$
Estas son nuestras dos ecuaciones para minimizar $f$ sujeto a $g(x)=0$ . Creo que esto debería ser suficiente información para resolverlo desde aquí.
Pero a menudo veo una formulación de una sola ecuación escrita algo así como $$L(x,\lambda) = f(x) - \lambda g(x).$$
Preguntas (o grupos de preguntas):
- ¿Cuál es la relación entre estas dos formulaciones? ¿Parece que la primera es sólo una derivada de la segunda? ¿Cómo llegaríamos a la formulación de ecuación única?
- ¿Para qué sirve la segunda si la primera (es decir, el par de ecuaciones) basta para resolverlo?
- En un problema aplicado, ¿trataríamos de pasar de la primera a la segunda? Parece que el primero es un problema manejable, y no entiendo muy bien de dónde sale el segundo.