6 votos

cierta confusión sobre el concepto de gradiente

Creo que todo el mundo debería conocer los derivados direccionales $D_vf=\nabla f\cdot v$ pero, en realidad, ¿por qué es así? Como yo sé, los derivados es $\displaystyle\lim_{h\rightarrow 0} \frac{f(x+h)-f(x)}{h}$ pero esto es un escalar no un vector. Entonces, ¿por qué es cierto?

1 votos

Esta es la definición de derivada para una función (posiblemente vectorial) de una variable escalar. Lo que quieres es la definición de derivada para una función escalar de una variable vectorial.

4voto

Silver Gun Puntos 25

Probablemente te estés haciendo esta pregunta porque en los cursos de cálculo no nos centramos en demostrar sino en calcular. El hecho de que $D_f = \nabla f \cdot v$ no es realmente la forma correcta de verlo (es decir, como un producto escalar) para entender por qué ésta es la definición lógica. La mejor forma de verlo es $\nabla f$ como transformación lineal y ver $\nabla f \cdot v$ como la evaluación de esta transformada lineal en $v$ . Intentaré ser más claro.

En una dimensión, cuando se calcula la derivada, se obtiene un número real. Este número real está en correspondencia uno a uno con una transformación lineal, $D_f(x)$ que asocia a cada número $v$ el nuevo número $D_f(x) \cdot v$ . En otras palabras, esto podría considerarse como un derivada unidimensional direccional (tomando números diferentes de $1$ como en el $2$ -no es muy pertinente; podemos limitarnos a los vectores de norma $1$ Por lo tanto $\pm 1$ son los únicos casos interesantes). Así que tiene sentido que en la dirección $-1$ obtenemos $-D_f$ ya que en la dirección opuesta de la pendiente, la variación es menos la variación que tendríamos en la dirección positiva de la pendiente.

En $\mathbb R^n$ se define una función como diferenciable en un punto $x$ cuando existe una transformación lineal $L(x)$ (o un $n \times 1$ si no está familiarizado con estos conceptos) tal que $$ \lim_{v \to 0} \frac{ f(x + v) - f(x) - L(x)v }{\| v \|} = 0. $$ En este caso $L(x)$ se dice que es el derivado de $f$ en $x$ .

Utilizando el teorema de Taylor, se puede deducir que $L(x) = \nabla f(x)$ cuando $f$ es diferenciable.

Tenga en cuenta que también puede sentir por qué esta definición debe mantener, y ver por qué $D_f = \nabla f \cdot v$ de esta manera ; si define $g(h) = f(x+hv)$ te das cuenta de que $g'(0) = \nabla f \cdot v$ por el regla de la cadena . Es otra forma de pensarlo. ¿Lo veis? Tienes, escribiendo $v = (\|v\| \cos \theta, \|v\| \sin \theta)$ : \begin{align} g'(0) & = \frac{\partial f}{\partial x} \frac{\partial (x+hv)_x}{\partial h} + \frac{\partial f}{\partial y} \frac{\partial(x+hv)_y}{\partial h} \\\ & = \frac{\partial f}{\partial x} \|v\| \cos \theta + \frac{\partial f}{\partial y} \|v\| \sin \theta = \nabla f \cdot (\|v\| \cos \theta, \|v\| \sin \theta) = \nabla f \cdot v. \end{align}

Espero que le sirva de ayuda,

0 votos

He hecho mi pequeña prueba con $f : \mathbb R^2 \to \mathbb R$ pero la misma prueba vale para $f : \mathbb R^n \to \mathbb R^m$ Sólo tienes que escribir más notación. Quería mantenerlo simple y dar la sensación.

3voto

Paul Puntos 13239

Permítanme centrarme en la función de dos variables: es decir $f:\mathbb{R}^2\rightarrow\mathbb{R}$ . (Se puede generalizar fácilmente a $n$ variables sustituyendo $2$ por $n$ en lo sucesivo) Entonces gradiente de $f$ en $(x_0,y_0)$ , $\nabla f(x_0,y_0)$ es una $2$ -dado por $$\nabla f(x_0,y_0)=(\frac{\partial f}{\partial x}(x_0,y_0),\frac{\partial f}{\partial y}(x_0,y_0)).$$ Dado un vector unitario cualquiera $v=(v_1,v_2)$ El derivada direccional $D_vf$ de $f$ en el punto $(x_0,y_0)$ en la dirección $v$ se define como $$D_vf(x_0,y_0)=\lim_{t\rightarrow 0}\frac{f(x_0+tv_1,y_0+tv_2)-f(x_0,y_0)}{t}.$$

Por lo tanto, la derivada direccional $D_{(1,0)}f$ no es más que la derivada parcial de $f$ con respecto a $x$ es decir $D_{(1,0)}f(x_0,y_0)=\frac{\partial f}{\partial x}(x_0,y_0)$ . Del mismo modo, la derivada direccional $D_{(0,1)}f$ no es más que la derivada parcial de $f$ con respecto a $y$ es decir $D_{(0,1)}f(x_0,y_0)=\frac{\partial f}{\partial y}(x_0,y_0)$ .

Entonces la fórmula que has dado se deduce de la regla de la cadena: $$D_vf(x_0,y_0)=\lim_{t\rightarrow 0}\frac{f(x_0+tv_1,y_0+tv_2)-f(x_0,y_0)}{t}$$ $$=\frac{d}{dt}(f(x_0+tv_1,y_0+tv_2))\big|_{t=0}=\frac{\partial f}{\partial x}(x_0,y_0)v_1+\frac{\partial f}{\partial y}(x_0,y_0)v_2=\nabla f(x_0,y_0)\cdot v.$$

Espero que le sirva de ayuda.

0 votos

Quiere decir $Df(x_0,y_0)\cdot v=D_vf(x_0,y_0)$

0 votos

@johhy: sí, tienes razón. Lo siento. Véase mi respuesta editada.

0 votos

$\nabla f(x_0,y_0)\cdot v$ => $\frac{\partial f}{\partial x}$ está en la misma dirección que el vector $v_1$ ¿Verdad?

2voto

Joseph Perkins Puntos 94

Por tanto, creo que estás confundido sobre el concepto de diferencial total, lo que te lleva a un malentendido del gradiente y las derivadas direccionales. Así, para una función, digamos $f(x,y,z)$ definimos $df$ (no $\Delta f$ ) de la siguiente manera, $$df = \frac{\partial f}{\partial x} dx + \frac{\partial f}{\partial y} dy + \frac{\partial f}{\partial z} dz$$

Podemos entender la motivación de esta definición y que tenga sentido comprendiendo algunas de sus propiedades. Así pues, enumeraré tres que se me ocurren,

  • Codificar cómo los cambios en $x,y,z$ afectar a $f$
  • Marcador de posición para pequeñas variaciones $\Delta x, \Delta y, \Delta z$ para obtener la fórmula de aproximación $\Delta f \approx f_{x} \Delta x + f_{y} \Delta y + f_{z} \Delta z$ (donde $f_{i}$ es la derivada parcial de $f$ con respecto a $i$ )
  • Dividir por algo así como $dt$ para obtener una tasa de cambio. Cuando $x=x(t), y=y(t), z=z(t)$ entonces $$\frac{df}{dt} =\frac{\partial f}{\partial x} \cdot \frac{dx}{dt} + \frac{\partial f}{\partial y} \cdot \frac{dy}{dt} + \frac{\partial f}{\partial z} \cdot \frac{dz}{dt}$$ por la regla de la cadena.

Así que, en general, se puede pensar en el diferencial total $df$ de una función como lo que codifica cómo $f$ cambia y tiene capacidad para cambiar.

El vector gradiente se define de la siguiente manera vector , $$\nabla w = \left(\frac{\partial w}{\partial x}, \frac{\partial w}{\partial y}, \frac{\partial w}{\partial z}\right)$$ Por lo tanto, como he publicado en mi respuesta anterior a su pregunta aquí , podemos derivar las propiedades de cómo el vector gradiente es perpendicular a la superficie nivelada y tal. Parece que estás un poco atascado en el modo de pensar de una sola variable. La definición de la derivada como el límite que sugirió está hablando de un concepto diferente que el vector gradiente. El vector gradiente se puede considerar como un "campo escalar" de una función y como tal representa algo más que el límite a medida que un valor x se acerca al valor de la función.

En cuanto a entender ahora el concepto de derivada direccional $$\frac{dw}{ds} \mid_{\hat{u}}$$ Geométricamente lo considero como la pendiente de un corte de la gráfica por un plano vertical paralelo a $\hat{u}$ . Consulte las otras respuestas para obtener una explicación adicional de algunas de las matemáticas que hay detrás de las derivadas direccionales.

0voto

El planteamiento que considero más satisfactorio es el siguiente, si conoces la teoría de una variable (cosa que asumo). Si $f:\mathbb{R}^n \rightarrow \mathbb{R}$ y $x\in \mathbb{R}^n$ es un punto y $v\in \mathbb{R}^n $ un vector, entonces por definición, $$ Df(x)(v)= \lim_{t\rightarrow 0}\frac{f(x+tv)-f(x)}{t}$$ es la derivada direccional de $f$ en dirección $v$ si existe el límite. Es la derivada de una función $\mathbb{R}\rightarrow \mathbb{R}$ por lo que está cubierto por la teoría unidimensional. Ahora bien, si $f$ es suficientemente bonito y $x$ es fijo, se puede comprobar que $$ v\mapsto Df(x)(v)$$ es un mapa lineal $\mathbb{R}^n \rightarrow \mathbb{R}$ . Del álgebra lineal se sabe que esto implica que existe un único vector $w= w(f,x)$ tal que $$Df(x)(v) = \langle w,v\rangle$$ con $\langle.,.\rangle$ que denota el producto escalar en $\mathbb{R}^n$ . Entonces, por definición, el gradiente de $f$ en $x$ es el vector $$\nabla f(x) := w$$ Este enfoque tiene la ventaja de poder aplicarse a situaciones más generales (variedades riemannianas y de Hilbert) y de ser conceptualmente sencillo. En particular, no depende de ninguna elección de sistema de coordenadas u otras opciones, por ejemplo, una base del espacio euclidiano o su dual. Tiene el inconveniente de que el gradiente se define mediante un teorema de existencia que no es tan explícito, por lo que todas las propiedades habituales tienen que deducirse utilizando este teorema de existencia (que a veces es bastante abstracto).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X