16 votos

¿Cuál es la intuición de la función diferencial total en dos variables?

Como la definición, el diferencial total de una función diferenciable con dos variables iguales: $$ dz=\frac{\partial z}{\partial x}dx+\frac{\partial z}{\partial y}dy $$ Dado que hay innumerables direcciones derivables Ahora lo confundo. Tengo dos confusiones en el seguimiento:

  1. Por qué el diferencial total es igual a la suma de sólo dos ¿diferencias parciales?
  2. Para una función diferenciable, el diferencial total es igual a la suma de dos direcciones diferentes cualesquiera ¿diferencias parciales?

0 votos

No se limita a dos, como se muestra en la definición, $\partial f=\frac{\partial f}{x_1} d(x_1) + \frac{\partial f}{x_2} d(x_2) +... \frac{\partial f}{x_i} d(x_i)$

0 votos

@Leth Me refiero a la función de dos variables. La función de tu comentario tiene $i$ variables. :)

0 votos

Entonces, no puedo entender qué es lo que se pide exactamente, porque dijiste "dos variables cualesquiera" pero ya hay sólo dos?

28voto

amd Puntos 2503

Prefiero partir de una definición de la derivada total que no esté ligada a un sistema de coordenadas específico. Si $f:\mathbb R^m\to\mathbb R^n$ Es decir, es diferenciable en $\mathbf v\in\mathbb R^m$ si existe un mapa lineal $L_{\mathbf v}:\mathbb R^m\to\mathbb R^n$ tal que $f(\mathbf v+\mathbf h)=f(\mathbf v)+L_{\mathbf v}[\mathbf h]+o(\|\mathbf h\|)$ . El mapa lineal $L_{\mathbf v}$ se llama diferencial o derivado total de $f$ en $\mathbf v$ , denotado por $\mathrm df_{\mathbf v}$ o simplemente $\mathrm df$ . La idea es que $\mathrm df_{\mathbf v}$ es la mejor aproximación lineal al cambio en $f$ cerca de $\mathbf v$ con el error de esta aproximación desapareciendo "más rápido" que el desplazamiento $\mathbf h$ .

En relación con algún par de bases específico para el dominio y el rango de $f$ , $\mathrm df$ puede ser representado por un $n\times m$ matriz. Para ver qué es esta matriz, se puede tratar $f$ como un vector de funciones: $$f(\mathbf v)=\pmatrix{\phi_1(\mathbf v)\\\phi_2(\mathbf v)\\\vdots\\\phi_n(\mathbf v)}$$ o, escrito en términos de coordenadas, $$\begin{align}y_1&=\phi_1(x_1,x_2,\dots,x_m)\\y_2&=\phi_2(x_1,x_2,\dots,x_m)\\\vdots\\y_n&=\phi_n(x_1,x_2,\dots,x_m).\end{align}$$ La matriz de $\mathrm df$ entonces resulta ser el Jacobiano matriz de derivadas parciales $$\pmatrix{{\partial\phi_1\over\partial x_1}&{\partial\phi_1\over\partial x_2}&\cdots&{\partial\phi_1\over\partial x_m}\\{\partial\phi_2\over\partial x_1}&{\partial\phi_2\over\partial x_2}&\cdots&{\partial\phi_2\over\partial x_m}\\\vdots&\vdots&\ddots&\vdots\\{\partial\phi_n\over\partial x_1}&{\partial\phi_n\over\partial x_2}&\cdots&{\partial\phi_n\over\partial x_m}}.$$ El vector de desplazamiento $\mathbf h$ puede escribirse como $\mathrm d\mathbf v=(\mathrm dx^1,\mathrm dx^2,\dots,\mathrm dx^m)^T$ . (El $\mathrm dx^i$ aquí pueden considerarse como diferenciales de funciones de coordenadas afines, pero eso no es un detalle importante para esta discusión).

Para el caso especial de una función escalar $f:\mathbb R^m\to\mathbb R$ , $\mathrm df[\mathbf h]$ se convierte en $${\partial f\over\partial x_1}\mathrm dx^1+{\partial f\over\partial x_2}\mathrm dx^2+\cdots+{\partial f\over\partial x_m}\mathrm dx^m.$$ Ahora, la derivada parcial ${\partial f\over\partial x_i}$ es sólo la derivada direccional de $f$ en la dirección de la $x^i$ -eje, por lo que esta fórmula expresa la derivada total de $f$ en términos de sus derivadas direccionales en un conjunto particular de direcciones. Obsérvese que no hay nada especial en la base que elegimos para $\mathbb R^m$ . Si elegimos una base diferente, $\mathrm df$ tendrá la misma forma, pero las derivadas se tomarán en un conjunto diferente de direcciones. En su caso de $\mathbb R^2$ Una base consiste en dos vectores, por lo que las derivadas en sólo dos direcciones son suficientes para especificar completamente la derivada total. Si se entiende como un mapa lineal de $\mathbb R^2$ a $\mathbb R$ Esto no debería ser una sorpresa.

6voto

Hurkyl Puntos 57397

Supongamos que tengo un campo escalar en el plano dado por la fórmula

$$ s = x + y^2 + e^r + \sin(\theta) $$

Sí, esta fórmula para $s$ mezcla coordenadas cartesianas y polares en el plano.

Utilizando esta fórmula, podemos calcular que el diferencial total es

$$ \mathrm{d}s = \mathrm{d}x + 2 y \,\mathrm{d}y + e^r \,\mathrm{d}r + \cos(\theta) \,\mathrm{d}\theta $$

Así que no pienses en ello como en un cálculo con el número justo de derivadas parciales, piensa en ello como la extensión de los métodos conocidos de cálculo de derivadas. Las derivadas parciales sólo entran en escena cuando se está interesado específicamente en calcular la diferencial de una función que tiene más de un argumento; por ejemplo, para calcular $\mathrm{d}f(s,t)$ para alguna función $f$ de dos argumentos.

Por supuesto, podemos reescribirlo; por ejemplo, utilizando ecuaciones como $\mathrm{d}x = \mathrm{d}(r \cos(\theta)) = \cos(\theta)\, \mathrm{d}r - r \sin(\theta) \, \mathrm{d}\theta$ y $\mathrm{d}y = \sin(\theta) \,\mathrm{d}r + r \cos(\theta) \, \mathrm{d}\theta$ para deshacerse del $\mathrm{d}x$ y $\mathrm{d}y$ y dejando el resultado en términos de $\mathrm{d}r$ y $\mathrm{d}\theta$ .

En el plano, sólo hay dos diferenciales independientes, por lo que siempre podemos reescribir como una combinación lineal de dos de ellas.

En mi opinión, la mejor manera de pensar en las cosas es que la diferencial total es la forma más natural de la derivada, y la derivada parcial es un funcional lineal sobre las formas diferenciales; por ejemplo, en el estándar $x-y$ coordenadas, $\partial/\partial x$ es el mapeo que envía $\mathrm{d}x \to 1$ y $\mathrm{d}y \to 0$ .

Así, utilizando la notación $\partial z / \partial x$ por la acción de $\partial / \partial x$ en $\mathrm{d}z$ vemos que si tenemos una ecuación

$$ \mathrm{d}z = f \,\mathrm{d}x + g \,\mathrm{d}y $$

entonces

$$ \frac{\partial z}{\partial x} = f \cdot 1 + g \cdot 0 = f$$ $$ \frac{\partial z}{\partial y} = f \cdot 0 + g \cdot 1 = g$$

y así tendríamos

$$ \mathrm{d}z = \frac{\partial z}{\partial x}\, \mathrm{d}x + \frac{\partial z}{\partial y} \,\mathrm{d} y$$

Además, otra ventaja de la diferencial total respecto a la derivada parcial es que es autónoma. En el plano, $\partial / \partial x$ no tiene ningún significado por sí mismo; por ejemplo, si ponemos $w=x+y$ entonces $\partial / \partial x$ significa algo diferente cuando se expresan las cosas en función de $(x,y)$ que cuando se expresan las cosas en función de $(x,w)$ . (en el primero, envía $\mathrm{d}y \to 0$ en el segundo envía $\mathrm{d}w \to 0$ y por lo tanto $\mathrm{d}y \to -1$ ).

1 votos

Aparte: la notación que prefiero cuando se trata de funciones es $\mathrm{d}f(s,t) = f_1(s,t) \mathrm{d}s + f_2(s,t) \mathrm{d}t$ . Esto enfatiza que estamos tomando la derivada de la función con respecto a uno de sus lugares, en lugar de algo relacionado con la variable real que introducimos. Una característica es que si tenemos $s=t=x$ entonces $f_1(x,x)$ es completamente inequívoco cuando $\partial f(x,x) / \partial x$ no lo es.

5voto

Michael Hardy Puntos 128804

Cualquier cambio infinitamente pequeño en $(x,y)$ incluye un cambio $dx$ en $x$ y un cambio $dy$ en $y$ . El cambio resultante en $z$ resultante del cambio de $x$ es $\dfrac{\partial z}{\partial x} \, dx$ y a eso le añadimos un cambio en $z$ resultante del cambio de $y$ .

0 votos

"incluye un cambio dx en x y un cambio dy en y"..Incluye innumerables direcciones en función de dos variables. :)

0 votos

@mayi : El cambio de ubicación se caracteriza totalmente por los cambios en $x$ y $y$ . El hecho de que uno pueda elegir otros sistemas de coordenadas no altera eso. $\qquad$

5voto

user99914 Puntos 1
  1. No es que $dz$ contiene sólo dos derivadas direccionales. En cambio, se puede pensar en $$ dz = \frac{\partial z}{\partial x } dx + \frac{\partial z}{\partial y }dy$$ como representación de $dz$ bajo la base $\{dx, dy\}$ . Dejemos que $v = (v_1, v_2)$ sea un vector, entonces $$dz (v) = \frac{\partial z}{\partial x } dx (v)+ \frac{\partial z}{\partial y }dy(v) = \frac{\partial z}{\partial x } v_1 + \frac{\partial z}{\partial y }v_2 = D_v z,$$ donde $D_v z$ es la derivada direccional de $z$ a lo largo de la dirección $v$ . Así que todas las derivadas direccionales de $z$ ya está codificado en la fórmula.

  2. Es casi cierto. Deja que $v, w$ ser dos independiente vectores. Sea $v^*, w^*$ sea el vector dual definido por $$\tag{1} v^*(av + bw) = a,\ \ \ w^*(av + bw) =b,\ \ \ \forall a, b \in \mathbb R.$$ Desde $(1)$ podemos representar $v, w$ utilizando la base $\{dx,dy\}$ : en efecto, si escribimos $$\tag{2} \begin{pmatrix}v^* \\ w^* \end{pmatrix} = \begin{pmatrix}A & B\\ C & D \end{pmatrix} \begin{pmatrix}dx \\ dy \end{pmatrix},$$ se ve que $$\tag{3} \begin{pmatrix}A & B\\ C & D \end{pmatrix} \begin{pmatrix}v_1 & w_1\\ v_2 & w_2 \end{pmatrix}= \begin{pmatrix}1 & 0\\ 0 & 1 \end{pmatrix}, \Rightarrow \begin{pmatrix}A & B\\ C & D \end{pmatrix} =\begin{pmatrix}v_1 & w_1\\ v_2 & w_2 \end{pmatrix}^{-1} $$ (necesitamos que $\{v, w\}$ sean linealmente independientes para que el lado derecho esté definido). Por lo tanto, tenemos, utilizando $(2)$ y $(3)$ , $$\begin{split} (D_v z) v^* + (D_w z) w^* &= \begin{pmatrix} D_v z & D_wz\end{pmatrix} \begin{pmatrix} v^* \\ w^*\end{pmatrix} \\ &= \begin{pmatrix} v_1\frac{\partial z}{\partial x} + v_2 \frac{\partial z}{\partial y} & w_1 \frac{\partial z}{\partial x} + w_2 \frac{\partial z}{\partial y}\end{pmatrix} \begin{pmatrix} v^* \\ w^*\end{pmatrix} \\ &= \begin{pmatrix} \frac{\partial z}{\partial x} & \frac{\partial z}{\partial y}\end{pmatrix} \begin{pmatrix} v_1 & w_1 \\ v_2 & w_2 \end{pmatrix}\begin{pmatrix} v^* \\ w^*\end{pmatrix}\\ &= \begin{pmatrix} \frac{\partial z}{\partial x} & \frac{\partial z}{\partial y}\end{pmatrix} \begin{pmatrix} dx \\ dy\end{pmatrix} \\ &=\frac{\partial z}{\partial x} dx + \frac{\partial z}{\partial y}dy = dz \end{split}$$ Por tanto, es cierto que se pueden utilizar dos vectores independientes cualesquiera para representar $dz$ como $$dz = (D_v z) v^* + (D_wz) w^*.$$

0 votos

Parece que te has olvidado del signo más. $\qquad$

2voto

Yo también estaba confundido sobre esto, hasta que aprendí que $(\frac{\partial z}{\partial x},\frac{\partial z}{\partial y})$ es un objeto de tipo vectorial.

Lo que significa es que se pueden rotar los ejes de coordenadas para que apunten en cualquier dirección y reescribir la derivada total en términos de las derivadas parciales a lo largo de esos ejes, y bajo tal rotación las derivadas parciales y los desplazamientos dx y dy se transforman de tal manera que dejan la derivada total sin cambios.

Fue la explicación de Feynman en Volumen II Capítulo 2 eso aclaró mi confusión.

0 votos

Gracias por tu enlace. Me resulta muy útil.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X