5 votos

Derivada total de dimensión superior

Me estoy enseñando algo de cálculo dimensional superior, y actualmente estoy atascado en la definición de la derivada total. El libro que estoy usando es Principios del análisis matemático de Walter Rudin, y define la derivada como

Supongamos que $E$ es un conjunto abierto en $\mathbb{R}^n$ , $f$ mapas $E$ en $\mathbb{R}^m$ y $x \in E$ . Si existe una transformación lineal $A$ de $\mathbb{R}^n$ en $\mathbb{R}^m$ tal que $$ \lim_{h \to 0} \frac{|f(x + h) - f(x) - Ah|}{|h|} = 0, $$

entonces decimos que $f$ es diferenciable en $x$ y escribimos

$$ f'(x) = A. $$

Mi confusión proviene de la $Ah$ término por dos razones: otros textos definen este término como $L(v)$ para alguna función lineal $L$ , y porque Rudin también escribe que "ya que $A \in L(\mathbb{R}^n, \mathbb{R}^m), Ah \in \mathbb{R}^m$ "que indican que $A$ está tomando $h$ como argumento. Esto no tiene sentido para mí, para suponer que $f$ fuera también lineal, entonces el límite implica que la función lineal $A$ es $f$ sí mismo:

Si escribimos $A(h)$ destacar que $A$ es función de $h$ entonces por la linealidad de $f$ el numerador del límite se convierte en $$ f(x + h) - f(x) - A(h) = f(h) - A(h) $$ para que el límite sea cero precisamente cuando $A = f$ . Sin embargo, ¡la derivada de una función lineal no debe ser la misma función lineal! ¿Cuál es la forma correcta de entender esta definición? ¿Y cómo podría encontrar la derivada de una función arbitraria? Por ejemplo, ¿cuál es la derivada de la función $$ g : \mathbb{R}^2 \to \mathbb{R}, g(x, y) = xy $$ según esta definición?

2voto

Allan Puntos 8

Me parece que hay dos cosas que te confunden:

  1. $A$ se considera a veces como una matriz y a veces como una función lineal. Como función, asigna a un vector $h$ en $\mathbb{R}^n$ el vector $A\cdot v$ en $\Bbb{R}^m$ (donde en el término " $A\cdot v$ "pensamos en ella como una matriz y en la multiplicación como una multiplicación matricial).
  2. La derivada total no es (exactamente) lo mismo que la derivada ordinaria. Como has dicho, suele considerarse una función lineal en lugar de una matriz. La derivada total de una función lineal $f$ es $f$ mismo. Sin embargo, como habrás notado, también podemos pensar en ella como una matriz. Más información a continuación.

Si $f$ es una función de $\mathbb{R}^n$ a $\Bbb{R}^m$ su derivada total, que prefiero denotar por $Df$ en un momento dado en $\Bbb{R}^n$ - una función lineal de $\Bbb{R}^n$ a $\Bbb{R}^m$ . Así que si $f:\Bbb{R}\to\Bbb{R}$ es una función real ordinaria, $Df(x)$ es una función lineal de $\Bbb{R}$ a $\Bbb{R}$ para cualquier $x\in \Bbb{R}$ . Pero esta función lineal está muy relacionada con el valor de la derivada ordinaria de $f$ como en el cálculo ordinario. Si denotamos por $f'$ la derivada habitual de $f$ se puede ver que $Df(x)$ es, de hecho, la función lineal $t\mapsto f'(x)t$ .

De hecho, ambos puntos equivalen a lo mismo: identificar una función lineal a partir de $\mathbb{R}^n$ a $\Bbb{R}^m$ con un $n\times m$ matriz real. Para cualquier función lineal $f$ de $\mathbb{R}^n$ a $\Bbb{R}^m$ hay precisamente una $n\times m$ matriz real $A$ tal que $$f(v)=A\cdot v$$ y muy a menudo se denota la función $f$ por $A$ e identifica estos dos objetos. Esto explica el primer punto que le confundió, pero también el segundo: si $f:\Bbb{R}\to\Bbb{R}$ es una función real, entonces la matriz associated a su derivada total en un punto $x$ es un $1\times 1$ matriz real cuya única entrada es exactamente igual a $f'(x)$ (la derivada ordinaria de $f$ en $x$ ).

Espero que esto aclare un poco... No probé todo lo que escribí. Aunque las cosas que no probé pueden ser buenos ejercicios.

No estoy seguro de que Rudin sea el mejor libro para el autoaprendizaje. Creo que Análisis de variedades de Munkres es mucho mejor: lo explica todo a fondo, y probablemente explique con más detalle todo lo que he escrito más arriba. Si no tienes profesor (e incluso si lo tienes), lo mejor es estudiar con un libro así.

1voto

pje Puntos 101

Cita del libro de Rudin "9.4 Definiciones":

Obsérvese que a menudo se escribe $Ax$ en lugar de $A(x)$ si $A$ es lineal.

Esto significa que su interpretación de que $A$ está tomando $h$ como argumento es correcto.

Dada una función $f : E \to \mathbb{R}^m$ donde $E \subset \mathbb{R}^n$ es abierta, la derivada de $f$ en $x \in E$ (si existe) es una transformación lineal $f'(x) \in L(\mathbb{R}^n,\mathbb{R}^m)$ . Puede entenderse como la mejor aproximación lineal de $f$ en $x$ . ¿Qué significa esto? Una aproximación lineal de $f$ en $x$ es una función de la forma $l_A(x') = f(x) + A(x' - x)$ con un $A$ . Obviamente tenemos $f(x) = l_A(x)$ . Para ser una aproximación lineal de $f$ exigimos que el error absoluto $(f(x') - l_A(x')) \to 0$ como $x' \to x$ . Es fácil ver que $f$ tiene una aproximación lineal en $x$ sólo si $f$ es continua en $x$ . En este caso, cualquier $A$ es suficiente. Sin embargo, las aproximaciones lineales en este sentido son en general pobres. Podemos hacerlo mejor si exigimos que el error relativo

$$\frac{|f(x') - l_A(x'))|}{|x'-x|} \to 0$$

como $x' \to x$ . Si esto se cumple, obtenemos una aproximación lineal realmente buena de $f$ por $l_A$ De hecho, el mejor posible uno. Esto significa que si $B \ne A$ entonces $l_B$ no tiene la propiedad de error relativo anterior.

La derivada de una transformación lineal $A : \mathbb{R}^n \to \mathbb{R}^m$ es de hecho $A'(x) = A$ en cualquier $x \in \mathbb{R}^n$ . Esto no es en absoluto sorprendente si se piensa en la mejor aproximación lineal de $A$ .

Para calcular la derivada de una función $f$ (sin adivinarlo), necesitas métodos adicionales. En el libro de Rudin los encontrarás en "9.16 Derivadas parciales".

Sin embargo, para su función $g$ puede comprobar fácilmente que $g'(x,y)$ como se indica en el comentario de Daniel Littlewood es la derivada de $g$ en $(x,y)$

1voto

Chris Custer Puntos 67

En cada $x\in\mathbb R^n$ obtenemos $df_x: \mathbb R^n\to \mathbb R^m$ dada por la matriz jacobiana de primeras derivadas parciales: $df_x=(a_{ij})$ donde $a_{ij}=\frac{\partial f_i}{\partial x_j}$ .

En su ejemplo, ( $g:\mathbb R^2\to\mathbb R$ por $g(x,y)=xy$ ), tenemos $dg_{(x,y)}=\begin{pmatrix}g_x\\g_y\end{pmatrix}=\begin{pmatrix}y\\x\end{pmatrix}$ .

Es bien sabido (y fácil de demostrar) que la derivada de una transformación lineal es ella misma. (La derivada es la mejor aproximación lineal de una función, por lo que en el caso de una transformación lineal, la aproximación es exacta).

Por último, para la derivada total, esto se hace claramente desde el punto de vista de la geometría diferencial. Para $Tf$ (que de hecho es un functor ) tenemos un diagrama conmutativo: $$ \require{AMScd}\begin{CD}TM @>Tf>>TN\\ @VVV@VVV\\ M@>f>>N \end{CD} $$ donde $M$ y $N$ son colectores . Como referencia, recomendaría Spivak's Introducción completa a la geometría diferencial .

1voto

user26872 Puntos 11194

Consideremos el cálculo unidimensional. Una función lineal es de la forma $f(x) = a x$ . Podemos pensar en $a$ como el operador lineal definido por $a(x) = a x$ . Así, $f(x) = a(x)$ o $f = a$ . Tenga en cuenta que $f'(x) = a = f$ es decir, la derivada de $f$ evaluado en $x$ es el operador lineal (desnudo) $a=f$ pero que $f'(x) \ne f(x)$ .

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X