8 votos

Dos nociones de derivada total.

Dejemos que $f:\mathbb R^n\rightarrow \mathbb R^m$ sea una función. Por definición, $f$ es diferenciable en $a$ si existe un mapa lineal $D_af:\mathbb R^n\rightarrow\mathbb R^m$ tal que $$\lim_{h\rightarrow 0}\dfrac{||f(a+h)-f(a)-D_af(h)||}{||h||}=0$$ .

Cuando existe este límite, llamamos $D_af$ la derivada total de $f$ en $a$ y llamamos a la matriz correspondiente con respecto a la base habitual, la matriz jacobiana $J_af$ . Ahora $f$ puede escribirse como $f=(f_1,\cdots,f_m)$ donde cada $f_i:\mathbb R^n\rightarrow \mathbb R$ y $f(x)=(f_1(x),\cdots,f_m(x))$ .

Definimos el derivada parcial de $f_i$ en $a=(a_1,\cdots,a_n)$ en dirección a $x_j$ por el número real (si existe)

$$\dfrac{\partial f_i}{\partial x_j}(a)=\lim_{h\rightarrow 0}\dfrac{f_i(a_1,\cdots,a_j+h,\cdots,a_n)-f_i(a)}{h}$$

Y demostramos que cuando $f$ es diferenciable en $a$ entonces todos los números reales $\dfrac{\partial f_i}{\partial x_j}(a)$ y los elementos de la matriz $(J_af)_{i,j}=\dfrac{\partial f_i}{\partial x_j}(a)$ .

Ahora veo en los artículos de la wikipedia que dan el nombre derivado total también para alguna otra noción: dado un mapa $g:\mathbb R^n\rightarrow \mathbb R$ entonces la derivada total de $g$ con respecto a $x_j$ es $$\dfrac{dg}{dx_j}=\dfrac{\partial g}{\partial x_1}\dfrac{dx_1}{dx_j}+\cdots+\dfrac{\partial g}{\partial x_n}\dfrac{dx_n}{dx_j}$$

Mis preguntas 1) ¿Es la fórmula anterior una definición de $\dfrac{dg}{dx_j}$ ?

2) ¿Es la noción de $\dfrac{dg}{dx_j}$ reservado sólo para los mapas de valor real $g:\mathbb R^n\rightarrow \mathbb R$ ya que tiene derivadas parciales en su fórmula de definición?

3) ¿Cómo se relacionan estas dos nociones de derivada total?

0 votos

La fórmula de la derivada total debería resultar bastante natural. La función $g$ depende del $x_i$ y no son necesariamente independientes. Por lo tanto, una simple aplicación de la regla de la cadena debería hacerlo evidente.

0 votos

¡¡¡Realmente no puedo seguir las respuestas ya que introducen otras nociones y otras notaciones sin ninguna definición, y hablando de la derivada total sin mencionar cuál de las dos mencioné en mi pregunta, además no veo ninguna respuesta que relacione las dos nociones de derivada total!!! Gracias por su comprensión

5voto

Emanuele Paolini Puntos 14186

El derivado total es sólo una pieza de notación para superar algunas dificultades cuando se trata de la notación de Leibniz.

Considere la función $f(x,y)=x^2+y$ . Si está de acuerdo en que $x$ y $y$ en la definición de $f$ son sólo marcadores de posición debe estar de acuerdo en que $f(y,x)=y^2+x$ y que $f(t,t^2)=2t^2$ .

Ahora la pregunta es: ¿qué hace $\partial f / \partial x$ ¿significa? Escrito así se interpretaría $\partial/\partial x$ como la derivada de $f$ con respecto a la primera variable. Obsérvese que la variable $x$ ya no es un simple marcador de posición, sino que tiene un significado convencional.

Por ejemplo, considere lo siguiente: $$ \frac{\partial f(y,x)}{\partial x}. $$ Ahora la interpretación no es clara... ¿se refiere a la derivada con respecto a la primera o a la segunda variable?

Mezclar variables así no es bueno... pero a veces hay que estar preparado para resolver la ambigüedad. Considere una función $f(x,t)$ que representan una cantidad que depende del espacio $x$ y el tiempo $t$ . Así que se entiende que $\partial f/\partial t$ es la derivada con respecto a la segunda componente (que es el tiempo). Supongamos ahora que tenemos una partícula que se mueve con la ley $x=t^2$ . Si se evalúa la función $f$ en la partícula se obtiene $$ f(x(t),t) $$ y si se quiere calcular la derivada de esta función se puede utilizar la regla de la cadena y obtener $$ \frac{d}{dt} f(x(t),t) = \frac{\partial}{\partial x} f(x(t),t)\cdot x'(t) + \frac{\partial }{\partial t} f(x(t),t). $$ Ahora la cuestión es que a menudo es útil reducir la notación escribiendo $x$ en lugar de $x(t)$ y $f$ en lugar de $f(x,t)$ por lo que la fórmula anterior podría escribirse como $$ \frac{d}{dt} f(x,t) = \frac{\partial}{\partial x} f(x,t) \cdot x'(t) + \frac{\partial }{\partial t} f(x,t) $$ o $$ \frac{df}{dt} = \frac{\partial f}{\partial x} \cdot x' + \frac{\partial f}{\partial t}. $$

Ahora ves que $d/dt$ y $\partial/\partial t$ asumen diferentes significados...

1voto

Jeremy Daniel Puntos 2519

Lo que tú llamas derivada total, yo prefiero llamarlo diferencial ya que es más estándar y no lleva a confusión.

La noción de diferencial total se utiliza cuando las variables de su espacio tienen interdepedencias. Permítanme dar dos ejemplos:

Considere la función $f(x,y) = xy$ en $\mathbb{R}^2$ . Su derivada parcial respecto a $x$ es $y$ . Su diferencial es $df = ydx + xdy$ . Ahora, supongamos que usted mira su función, no en todo el espacio $\mathbb{R}^2$ pero en algún submanifiesto $M$ . Hay esencialmente dos maneras de describir esta variedad (aquí una curva), ya sea mediante una ecuación $g(x,y) = 0$ o por una parametrización $\gamma(t) = (x(t),y(t))$ .

En el primer caso, la ecuación da una ecuación en el $1$ -forma $dx$ y $dy$ en $M$ Es decir $\partial_x g(x,y) dx + \partial_y g(x,y) dy = 0$ . También se puede escribir como $dy = -\frac{\partial_y g(x,y)}{\partial_x g(x,y)} dx$ . Así que si miras $f_{| M}$ su diferencial viene dado por $(y-x\frac{\partial_y g(x,y)}{\partial_x g(x,y)})dx$ . Y la cantidad $y-x\frac{\partial_y g(x,y)}{\partial_x g(x,y)}$ se llama la derivada total de $f$ en relación con $x$ en el submanifold $M$ .

En el segundo caso, podemos considerar $f$ en función de $t$ y su derivada parcial respecto a $t$ viene dada simplemente por la regla de la cadena: $\partial_t f = y \partial_t x + x \partial_t y$ . En cierto sentido, esto puede considerarse como una derivada total. En general, lo llamamos realmente una derivada total cuando su parametrización misma es función de $x$ Es decir $\gamma(x) = (x, y(x))$ con cierto abuso de la notación. Entonces la derivada total de $f$ en relación con $x$ es simplemente la derivada parcial de $f \circ \gamma$ en relación con $x$ Es decir $\partial_x f + \partial_y f \partial_x y$ .

Generalmente, una variable es el tiempo, y las otras variables se piensan en función del tiempo (lo que equivale a mirar su función en alguna curva parametrizada por el tiempo).

Obsérvese que para hablar de la derivada total respecto a una variable, la submanifold tiene que ser $1$ -dimensional.

Esto debería responder $1)$ y $3)$ . Si se tiene una función con valor vectorial, se puede hacer lo mismo con cada componente, por lo que la noción no es sólo para mapas de valor real. Esto responde a $2)$ .

0voto

(1) Sí, se puede interpretar como una definición para el notación $\frac{dg}{dx_j}$ . Como explico en (3) más adelante, esto es sólo un caso especial de la primera definición de la derivada total que das, así que en realidad no está definiendo un nuevo concepto; más bien, sólo estamos dando una nueva notación para una cosa que ya conocemos.

(2) Creo que esta segunda noción de derivada total se puede utilizar en general para funciones multivariables $g : \mathbb R^n \to \mathbb R^m$ pero en la práctica sólo lo he visto utilizar para funciones de tipo $\mathbb R^n \to \mathbb R$ (es decir, cuando la salida es un escalar).

(3) Las dos están muy relacionadas: la segunda noción es un caso especial de la primera. Para simplificar la escritura, llamaremos a la primera noción de derivada total "derivada total(1)", y a la segunda noción de derivada total "derivada total(2)".

Entonces la relación entre ambas es la siguiente: la derivada total(2) es el caso especial de la derivada total(1) cuando la capa intermedia de variables ( $x_1, \ldots, x_n$ en su ejemplo) son todas funciones de una sola variable ( $x_j$ en su ejemplo).

Para entenderlo, veamos un ejemplo: considere una función $w = f(x,y,t)$ , donde $x=g(t)$ y $y=h(t)$ también son funciones de $t$ . Esto se ajusta al caso especial mencionado anteriormente: las variables de la capa intermedia ( $x,y,t$ ) son todas funciones de una sola variable ( $t$ ). Esto debe significar que la derivada total(1) de $w$ es la misma que la derivada total(2) de $w$ .

La derivada total(1) de $w$ puede calcularse utilizando la regla de la cadena multivariable. Para mostrar explícitamente la composición, podemos definir una función $\phi(t) = (g(t), h(t), t)$ para que $w = f(\phi(t))$ . Por el regla de la cadena multivariable , $$D_t w = D_t (f \circ \phi) = D_{\phi(t)} f \circ D_t\phi$$ ¿Qué significa esto? En general (si eludimos la distinción entre un mapa lineal y una matriz que representa ese mapa), la derivada total(1) es una matriz de derivadas parciales. Sabemos que $\phi$ es una función de una sola variable $t$ por lo que la derivada total(1) $D_t\phi$ es un vector de las derivadas de las funciones componentes (es decir, una matriz de 3 por 1 de derivadas parciales, que en este caso son derivadas ordinarias de una sola variable), es decir $D_t \phi = (\frac{dg}{dt}, \frac{dh}{dt}, \frac{dt}{dt}) = (g'(t), h'(t), 1)$ . Y sabemos que $f$ es una función $\mathbb R^3 \to \mathbb R$ por lo que la derivada total(1) es el gradiente (también conocido como matriz de derivadas parciales de 1 por 3), es decir $D_{\phi(t)} f = \nabla f(\phi(t)) = (\frac{\partial f}{\partial x}, \frac{\partial f}{\partial y}, \frac{\partial f}{\partial t})$ . La composición $\circ$ en el lado derecho de la regla de la cadena nos indica que debemos interpretar esta expresión como una composición de mapas lineales, es decir, una multiplicación de matrices. Nuestras matrices son de 1 por 3 y de 3 por 1, así que podemos pensar en la multiplicación matricial como un producto punto: $$\begin{align}D_t w &= \begin{pmatrix}\frac{\partial f}{\partial x} & \frac{\partial f}{\partial y} & \frac{\partial f}{\partial t}\end{pmatrix} \begin{pmatrix}\frac{dg}{dt}\\ \frac{dh}{dt}\\ \frac{dt}{dt}\end{pmatrix} \\ &= \left(\frac{\partial f}{\partial x}, \frac{\partial f}{\partial y}, \frac{\partial f}{\partial t}\right) \cdot \left(\frac{dg}{dt}, \frac{dh}{dt}, \frac{dt}{dt}\right) \\ &= \frac{\partial f}{\partial x}\frac{dg}{dt} + \frac{\partial f}{\partial y}\frac{dh}{dt} + \frac{\partial f}{\partial t}\frac{dt}{dt}\end{align}$$

Ahora vamos a calcular la derivada total(2) de $w$ . Tenemos $$\frac{dw}{dt} = \frac{\partial f}{\partial x}\frac{dx}{dt} + \frac{\partial f}{\partial y}\frac{dy}{dt} + \frac{\partial f}{\partial t}\frac{dt}{dt}$$ Pero $\frac{dx}{dt} = \frac{dg}{dt}$ desde $x = g(t)$ y $\frac{dy}{dt} = \frac{dh}{dt}$ desde $y = h(t)$ . Así, la derivada total(1) y la derivada total(2) son iguales.

Sin embargo, la derivada total(2) sólo tiene sentido en el caso de que las variables de la capa intermedia sean todas función de alguna variable única. Si este no es el caso, entonces expresiones como $\frac{dx_1}{dx_j}$ no tienen sentido ya que $x_1$ y $x_j$ pueden variar de forma independiente (porque no asumimos ninguna relación funcional entre ellos). La derivada total(1) tiene sentido incluso en este caso (si $g : \mathbb R^n \to \mathbb R$ entonces es sólo el gradiente).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X