12 votos

¿Por qué cualquier derivada direccional arbitraria es siempre recuperable a partir del gradiente?

Entiendo lo que son las derivadas parciales, las derivadas direccionales y el gradiente. Incluso puedo seguir simbólicamente a partir de sus definiciones por qué:

$$D_\mathbf{u} f = \nabla f \cdot \mathbf{u}$$

Pero sin embargo me parece sorprendente que conocer la derivada en sólo 3 direcciones en un punto (el gradiente) sea suficiente para averiguar cuál debe ser en cualquier dirección. La ecuación establece que debe ser el caso de que la derivada en una dirección arbitraria debe ser una combinación ponderada (producto punto) el gradiente con los pesos determinados por cómo x-eje'y y la dirección u es. ¿Qué me impide construir una función en la que esto no sea cierto? ¿Por qué un aumento simultáneo de x e y no puede dar un resultado dramáticamente diferente que cualquiera de los dos por separado? (por ejemplo, una función que aumenta en la dirección x+ y en la dirección y+, pero que cae dramáticamente a lo largo de la diagonal).

0 votos

Puedes encontrar esta pregunta y este relevante.

0 votos

Los comentarios no son para ampliar la discusión; esta conversación ha sido trasladado al chat .

12voto

JoshL Puntos 290

¿Por qué un aumento simultáneo de x e y no puede dar un resultado drásticamente diferente que cualquiera de los dos por separado? (por ejemplo, una función que aumenta en la dirección x+ y en la dirección y+, pero que cae drásticamente a lo largo de la diagonal).

Bueno, puede, pero entonces la función no será diferenciable. Un ejemplo concreto de una función que tiene un comportamiento diferente en el $x$ y $y$ ejes entonces tiene en medio es la función $z = r\sin(2 \theta)$ en coordenadas cilíndricas. Esta función no es diferenciable en el origen. Es continua en el origen y tiene pendientes de $0$ en el $x$ y $y$ direcciones allí - el $x$ y $y$ Los ejes están ambos contenidos en la gráfica de la función. Pero en otras direcciones las pendientes en el origen pueden ser cualquier otra cosa entre $1$ y $-1$ .

Recuerda que un punto y dos pendientes en direcciones no paralelas es todo lo que necesitamos para determinar completamente un plano. Así, si el plano tangente a la gráfica de $f(x,y)$ está bien definida en un punto, las pendientes del plano tangente en el $x^+$ y $y^+$ direcciones caracterizan completamente el plano. Un plano, al ser plano, no puede aumentar a lo largo de la $x^+$ y $y^+$ ejes y la disminución en el medio.

Si una función intentara hacer eso, no sería diferenciable en el punto en cuestión, no se aproximaría bien al plano que determina el gradiente. Este es el origen de la definición de diferenciabilidad: una función diferenciable tiene su pendiente en cada dirección determinada por esa dirección y las pendientes en el $x^+$ y $y^+$ direcciones.

Lo mismo ocurre en una dimensión, sólo que nos acostumbramos demasiado a ello para verlo. Podríamos preguntarnos: "¿por qué el comportamiento de una función en la $x^+$ dirección determinan el comportamiento en el $x^-$ ¿dirección? ¿Por qué una función no puede aumentar en ambos sentidos? $x^+$ y $x^-$ direcciones?". Por supuesto, una función puede hacer eso, como $y = |x|$ hace. Pero entonces la función no será diferenciable en el punto en cuestión, porque no estará bien aproximada por la línea que está determinada por la tasa de cambio de la $x^+$ dirección.

La situación en dos o más variables no es diferente. En una dimensión, la pendiente en el $x^+$ dirección determina una línea. En dos dimensiones, las pendientes en el $x^+$ y $y^+$ las direcciones determinan un plano. En cualquiera de los dos casos, definimos que la función es diferenciable si, alrededor del punto del que partimos, la función está bien aproximada por esa recta o plano en todas las direcciones que podemos recorrer, dado el número de dimensiones con el que trabajamos.

4voto

Nick A. Puntos 85

Esto se debe a la definición del gradiente y en general de lo que significa para una función $f$ sea diferenciable (en un punto $p_0$ decir).

Intuitivamente, porque $f$ es diferenciable en $p_0$ se aproxima mediante una función lineal (que en el caso de $\mathbb{R^n}$ es exactamente el gradiente) se aproxima a muy bien. Así que es lógico creer que en un pequeño barrio alrededor de $p_0$ $f$ se comporta casi como una función lineal. Estas aproximaciones se hacen más explícitas con el teorema de Taylor.

Permítanme decir que esta forma de pensar, aunque no es rigurosa, proporciona mucha intuición detrás de teoremas muy importantes, como el teorema de la función inversa.

1 votos

Algo falla en la primera frase del segundo párrafo.

4voto

grjj3 Puntos 34

Como dije en los comentarios, esto es sólo la regla de la cadena. Este es el argumento formal.

Por definición, la derivada direccional de $f:\mathbb{R}^n\supset U\to\mathbb{R}$ en $p$ en dirección a $u$ es

$$D_uf(p):=\lim_{t\to0}\frac{f(p+tu)-f(p)}{t}$$

Pero esto es también la definición de derivado de $g(t):=f(p+tu)$ en $t=0$ . En otras palabras,

$$D_uf(p)=g'(0)$$

Ahora, $g$ es una función compuesta: $g=f\circ\ell$ , donde

$$\ell(t)=p+tu$$

Por la regla de la cadena multivariante (estoy suponiendo que se cumplen las hipótesis de ese teorema),

$$g'(0)=(f\circ\ell)'(0)=f'\big(\ell(0)\big)\ell'(0)$$

Pero $\ell(0)=p$ , $\ell'(0)=u$ y $f'(p)=\nabla f(p)$ .

Concluimos

$$D_uf(p)=g'(0)=\nabla f(p)u$$

(No se necesita el producto punto en esta expresión, si se interpreta $\nabla f$ correctamente como un vector de filas).


En cuanto a la idea intuitiva, la cuestión es que en el límite infinitesimal (que es lo que miden las derivadas), una función diferenciable está bien aproximada por un lineal uno, por lo que su tasa de cambio en cualquier dirección debe ser una función lineal de los cambios en las direcciones de las coordenadas.

0 votos

Mi problema parece tener la misma respuesta que usted proporcionó, podría echar un vistazo a mi problema math.stackexchange.com/questions/2931023/

3voto

M. Winter Puntos 1070

Explicación geométrica

Esto se debe a que para una función diferenciable $f:\Bbb R\to\Bbb R^n$ una cantidad de $n$ vectores es suficiente para conocer el plano tangente . Todos los vectores tangentes se encuentran en el plano tangente y un $n$ -está determinado de forma única por $n$ vectores (linealmente independientes).

Si tienes una función con una "curva pronunciada" (por ejemplo, piensa en un tejado), en la que existen todas las derivadas direccionales, pero no hay un único plano tangente, entonces esto no funcionará porque no todos los vectores tangentes están en un plano.

Piensa en una función diferenciable como una función que tiene planos tangentes únicos en todas partes. Entonces tus contraejemplos no son diferenciables.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X