9 votos

¿Cómo funciona el método de multiplicadores de Lagrange fallar (en el clásico campo de las teorías con las restricciones locales)?

El método de los multiplicadores de Lagrange se utiliza para encontrar los extremos de $f(x)$ sujeto a las restricciones $\vec g(x)=0$ donde$x=(x_1,\dots,x_n)$$\vec g=(g_1,\dots,g_m)$$m \leq n$.

A pesar de que muchos libros de texto de llegar a la final ecuaciones argumentando que en un extrema, la variación de $f(x)$ debe ser ortogonal a la superficie de la $g(x)=0$, el "simple" (y eso que se ve comúnmente en la teoría de campo / optimización funcionales) es la construcción de la función de Lagrange $$ L(x,\lambda) = f(x) + \vec\lambda\cdot\vec g(x) $$ y la variación de w.r.t. $x$ $\lambda$ para obtener el vector de ecuaciones $$ \begin{align} &x:& 0 &= \nabla f(x) + \sum_i \lambda_i \nabla g_i(x) \,, \\ &\vec \lambda:& 0 &= \vec g(x) \ . \end{align} $$

El método sólo funciona si el extremal punto es un punto habitual de la superficie de restricción, es decir, si $\mathrm{rnk}(\nabla\vec g) = m$.

¿Cuál es la mejor manera de entender lo que va mal cuando los extremos no es un punto habitual de la restricción?

Y, lo que es más importante para mí, ¿cómo esta generalizar a campo de las teorías (es decir, la optimización funcionales) con las restricciones locales? ¿Cuál es el equivalente de la regularidad a condición de que las limitaciones en el campo de la teoría?

Ejemplos instructivos son más que bienvenidos.

12voto

CodingBytes Puntos 102

Genéricamente, el $m$ ecuaciones $g_i(x)=0$ definir un colector $S$ de la dimensión de $d:=n-m$. En cada punto de $p\in S$ $m$ gradientes $\nabla g_i(p)$ son ortogonales en el espacio de la tangente $S_p$$S$$p$. La condición de rnk$(\nabla g(p))=m$ significa que estos $m$ gradientes son linealmente independientes, por lo que se cubren la totalidad de complemento ortogonal $S_p^\perp$ que tiene dimensión $m=n-d$. En una condicional punto fijo $p$ $f$ el gradiente $\nabla f(p)$$S_p^\perp$, y si el rango se cumpla la condición, habrá constantes $\lambda_i$ tal que $\nabla f(p)=\sum_{i=1}^m \lambda_i\nabla g_i(p)$. En este caso el "receta" se encuentra el punto de $p$.

Considere ahora el siguiente ejemplo donde el rango de condición es violado: Las dos restricciones $$g_1(x,y,z):=x^6-z=0,\qquad g_2(x,y,z):=y^3-z=0$$ definir una curva de $S\subset{\mathbb R}^3$ con la representación paramétrica $$S: \quad x\mapsto (x,x^2,x^6)\qquad (-\infty < x <\infty).$$ La función de $f(x,y,z):=y$ asume su mínimo en $S$ en el origen $o$. Pero si hemos de calcular los gradientes de $$\nabla f(o)=(0,1,0), \qquad \nabla g_1(o)=\nabla g_2(o)=(0,0,-1),$$ resulta que $\nabla f(o)$ no es una combinación lineal de las $\nabla g_i(o)$. Como consecuencia de Lagrange método no va a traer este condicionalmente punto fijo a la palestra.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X