18 votos

¿Por qué funcionan los multiplicadores de Lagrange?

Sé que el método del multiplicador de Lagrange nos ayuda a evaluar los puntos críticos de $f$ en el límite cerrado de la restricción.

En otras palabras, resolvemos: $$\nabla f=\lambda \nabla g$$

Pero, ¿por qué funciona realmente este método? ¿Puede alguien darme una explicación, por favor? Gracias.

1 votos

Si $\nabla f=\lambda \nabla g$ significa que los dos gradientes son múltiplos escalares el uno del otro y, por tanto, paralelos. Así que cuando los gradientes de la superficie ( $f$ ) y la restricción ( $g$ ) se alinean, cualquier movimiento perpendicular a los gradientes te sacará de ese punto crítico.

28voto

$\nabla f$ es la dirección que hay que tomar (para aumentar el valor de $f$ ), y $\nabla g$ es la dirección en la que no puedes ir (porque es la dirección fuera de la superficie, y tienes que permanecer en ella). Cuando estos apuntan en la misma dirección, ningún movimiento posible supone una mejora.

Espero que sea obvio que esto es sólo un montón de intuición descuidada. Quizá sea un buen ejercicio para averiguar las matizaciones que hay que hacer para que se acerque más a lo realmente correcto.

12voto

Scott Holmes Puntos 41

Así que esto está extraído en gran parte del artículo de la wikipedia sobre lo anterior ( http://en.wikipedia.org/wiki/Lagrange_multiplier ) pero espero poder aclararlo.

Creo que los multiplicadores de Lagrange son más fáciles de entender en términos de vectores, por lo que los conceptos descritos se aplican principalmente a funciones de 2 variables, pero imagino que los conceptos se generalizan fácilmente a dimensiones más altas. Por lo tanto, para la discusión que sigue, se pretende que el $\nabla$ es $(\partial/\partial x,\partial/\partial y)$

Si tiene una función $f(x,y)$ describiendo una superficie sobre el plano x,y, una posible representación sería como una serie de curvas de nivel, curvas de constante $f$ . Del mismo modo, cualquier restricción sobre la variable $x,y$ puede reescribirse como $g(x,y) = c$ . Esta ecuación describe una única curva de nivel de $g(x,y)$ .

Para encontrar un mínimo de $f(x,y)$ sujeta a una restricción $g$ intentamos encontrar la posición en $g$ que se encuentra más abajo en f. Si se calculan los valores de $f$ moviéndose a lo largo del contorno $g$ , $f$ debe disminuir a medida que se acerca a los mínimos, y aumentar después. En los mínimos el cambio en $f$ debe ser cero. Para que esto sea cierto, el contorno representado por $g$ debe ser paralela a un contorno de $f$ , tal que infinitesimalmente cualquier movimiento a lo largo de $g$ es a lo largo del contorno de $f$ y no cambia $f$ El valor de la misma. Consideraciones similares se aplican a los máximos.

Ahora tenemos que traducir las afirmaciones anteriores en algo matemático: la cantidad $\nabla f$ puntos a lo largo de la dirección del cambio más rápido en $f$ ( http://en.wikipedia.org/wiki/Gradient ), por lo que debe ser un vector normal a los contornos de $f$ (de lo contrario, una componente del vector se encontraría a lo largo de un contorno, donde por definición f no cambia). Del mismo modo, la cantidad $\nabla g$ es normal a los contornos de $g$ y, por tanto, al contorno dado por nuestra restricción $g(x,y)=c$ . Encontrar el punto donde los contornos de $g$ y $f$ son tangenciales es ahora fácil. Sólo tenemos que encontrar los puntos donde las normales a $f$ y $g$ son paralelos $\implies \nabla f = \lambda \nabla g$ donde $\lambda \in R$ . Tenga en cuenta que si hay múltiples mínimos o máximos esto debería salir de las matemáticas.

0 votos

¿Por qué fue votado negativamente?

0 votos

Gracias Scott, otra buena explicación.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X