85 votos

¿Por qué el gradiente es normal?

Esta es una discusión un poco larga, así que por favor tengan paciencia conmigo. Hay un teorema que siempre me ha resultado curioso desde un punto de vista intuitivo y que ha sido pasado por alto en la mayoría de los libros de texto que he leído. Citando a Wikipedia el teorema es:

El gradiente de una función en un punto es perpendicular al conjunto de niveles de $f$ en ese momento.

Entiendo la prueba del artículo de Wikipedia, que es la forma estándar de ver las cosas, pero veo la prueba como algo mágico. Da una razón simbólica de por qué el teorema es cierto sin dar mucha intuición geométrica.

El gradiente da la dirección del mayor incremento, por lo que tiene sentido que una curva perpendicular sea constante. Por desgracia, esto parece ser un razonamiento al revés. Habiendo notado ya que el gradiente es la dirección de mayor incremento, podemos deducir que ir en una dirección perpendicular a él sería el incremento más lento. Pero no podemos razonar que este incremento más lento sea cero ni podemos argumentar que ir en una dirección perpendicular a una dirección constante nos daría una dirección de mayor incremento.

También agradecería alguna conexión de esta intuición con Multiplicadores de Lagrange que es otro teorema algo mágico para mí. Lo entiendo porque el álgebra funciona pero ¿qué pasa geométricamente?

Por último, ¿qué dice esto intuitivamente sobre la generalización en la que buscamos: maximizar $f(x,y)$ donde $g(x,y) > c$ .

Siempre he luchado por encontrar el modelo interno correcto que encapsule estas ideas.

4voto

jakeisonline Puntos 211

Imagina dos superficies: $S_1 : f(x,y,z) = c_1$ y $S_2 : f(x,y,z) = c_2$ donde $c_1 < c_2 $ . Ahora veamos qué ocurre en una región $ x \in (a,a+\Delta x),y \in (b,b+\Delta y) $ en el que $S_1$ es aproximadamente plana. Tomemos la perpendicular a $S_1$ líneas que se extienden desde los puntos de esquina de $S_1$ a $S_2$ . En la región que definen estas líneas, $S_2$ va a tener un punto $P_{min}$ con una distancia mínima de $S_1$ y un punto $P_{max}$ con la máxima distancia de $S_1$ . Definamos como $D$ la diferencia entre sus respectivas distancias de $S_1$ . Ahora podemos elegir arbitrariamente un $D' < D$ y una superficie de la misma forma existirá entre $S_1$ y $S_2$ con un punto $P'_{max}$ con la máxima distancia $D'$ de $S_1$ . Esto se permite porque $f(x,y,z)$ es continua y las superficies no pueden intersecarse. Sea $P'_{min}$ sea el punto con la mínima distancia a $S_1$ . Entonces la diferencia de sus respectivas distancias será menor que $D'$ . Si elegimos un $D'$ suficientemente pequeña la superficie resultante $S' : f(x,y,z) = c'$ será aproximadamente plana y paralelo a $S_1$ en la región especificada. Ahora el gradiente $\nabla f$ señala la dirección del mayor aumento de $f(x,y,z)$ . Dentro de la región, el camino más corto desde cualquier punto de $S_1$ a $S'$ es a través de la línea perpendicular. Como lo mismo ocurrirá con todas las superficies entre $S_1$ y $S'$ el gradiente será perpendicular a la superficie.

3voto

Felix Marin Puntos 262

$\newcommand{\+}{^{\dagger}}% \newcommand{\angles}[1]{\left\langle #1 \right\rangle}% \newcommand{\braces}[1]{\left\lbrace #1 \right\rbrace}% \newcommand{\bracks}[1]{\left\lbrack #1 \right\rbrack}% \newcommand{\ceil}[1]{\,\left\lceil #1 \right\rceil\,}% \newcommand{\dd}{{\rm d}}% \newcommand{\down}{\downarrow}% \newcommand{\ds}[1]{\displaystyle{#1}}% \newcommand{\equalby}[1]{{#1 \atop {= \atop \vphantom{\huge A}}}}% \newcommand{\expo}[1]{\,{\rm e}^{#1}\,}% \newcommand{\fermi}{\,{\rm f}}% \newcommand{\floor}[1]{\,\left\lfloor #1 \right\rfloor\,}% \newcommand{\half}{{1 \over 2}}% \newcommand{\ic}{{\rm i}}% \newcommand{\iff}{\Longleftrightarrow} \newcommand{\imp}{\Longrightarrow}% \newcommand{\isdiv}{\,\left.\right\vert\,}% \newcommand{\ket}[1]{\left\vert #1\right\rangle}% \newcommand{\ol}[1]{\overline{#1}}% \newcommand{\pars}[1]{\left( #1 \right)}% \newcommand{\partiald}[3][]{\frac{\partial^{#1} #2}{\partial #3^{#1}}} \newcommand{\pp}{{\cal P}}% \newcommand{\root}[2][]{\,\sqrt[#1]{\,#2\,}\,}% \newcommand{\sech}{\,{\rm sech}}% \newcommand{\sgn}{\,{\rm sgn}}% \newcommand{\totald}[3][]{\frac{{\rm d}^{#1} #2}{{\rm d} #3^{#1}}} \newcommand{\ul}[1]{\underline{#1}}% \newcommand{\verts}[1]{\left\vert\, #1 \,\right\vert}$ Toma dos puntos $\vec{R}$ y $\vec{R} + \delta\vec{R}$ en una superficie definida por $\fermi\pars{\vec{r}} = 0$ . Entonces, $\fermi\pars{\vec{R}} = 0$ y $\fermi\pars{\vec{R} + \delta\vec{R}} = 0$ . Entonces, $$ 0 = \lim_{\verts{\delta\vec{R}} \to 0} {\fermi\pars{\vec{R} + \delta\vec{R}} -\fermi\pars{\vec{R}} \over \verts{\delta\vec{R}}} = \nabla_{\vec{R}}\fermi\pars{\vec{R}}\cdot\lim_{\verts{\delta\vec{R}} \to 0}{\delta\vec{R} \over \verts{\delta\vec{R}}} $$ Siempre que $\hat{n}\pars{\vec{R}} \equiv \lim_{\verts{\delta\vec{R}} \to 0}\pars{% {\delta\vec{R}/ \verts{\delta\vec{R}}}}$ existe, $\hat{n}\pars{\vec{R}}$ es un "vector tangente" a la superficie en el punto $\vec{R}$ que da como resultado $\ds{\nabla_{\vec{R}}\fermi\pars{\vec{R}}\cdot\hat{n}\pars{\vec{R}} = 0}$ . Entonces $\ds{\color{#00f}{\large\nabla_{\vec{R}}\fermi\pars{\vec{R}}\perp\hat{n}\pars{\vec{R}}}}$ .

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X