Me gustaría hacer algunas afirmaciones sobre un objeto sencillo -la derivada de una función univariante- y aplicar y relacionar sus características y mi comprensión de las mismas con las funciones multivariantes.
Funciones univariantes. Una derivada de una función real $f: {\mathrm R} \to {\mathrm R}$ en el punto $a \in {\mathrm R}$ es la pendiente de la función en este punto; es decir, cuánto cambia el valor de la función con respecto al cambio de la variable, o
$$f'(a) = \lim_{h\to0} \frac{f(a + h) - f(a)}{h}.$$
La derivada de esta una función real $f: {\mathrm R} \to {\mathrm R}$ es la función $$f': a \mapsto f'(a)$$ que asigna un punto a la pendiente de la función $f$ en ese momento.
La derivada en un punto no es es la tangente a la gráfica de la función en ese punto, pero está estrechamente relacionada con ella. La tangente en el punto $a$ puede expresarse como
$$t(x) = f(a) + f'(a)(x-a),$$
que resulta ser la mejor aproximación lineal de la función $f$ alrededor de $a$ o el polinomio de Taylor de primer grado $T^{f,a}_1$ .
La función $f'(a)(x-a)$ es lineal en $x$ .
Funciones multivariadas. Dejemos que $f: {\mathrm R}^n \to {\mathrm R}^m$ , donde $m,\ n \in {\mathrm N}$ . Podemos considerar derivadas parciales de $f$ en $a \in {\mathrm R}^n$ definido, por ejemplo, como
$${\partial f\over\partial x_i} = \lim_{h \to 0} \frac{f(a + h{\bf e^i}) - f(a)}{h},$$
que es la derivada de la función en $a$ con respecto a $x_i$ y las demás variables se mantienen constantes, donde ${\bf e^i} = (0, \dots, 0, 1, 0, \dots, 0)$ ( $1$ es $i$ -a partir de la izquierda).
Son derivados de una sola variable funciones parciales y por lo tanto se les aplica lo mismo que he escrito en la primera sección.
El gradiente de la función en un punto es el vector de derivadas parciales en ese punto, es decir
$$\nabla f(a) = \Big({\partial f\over x_1}, \dots, {\partial f\over x_n}\Big).$$
Su significado geométrico es que apunta en la dirección del crecimiento más pronunciado mientras que su valor es el crecimiento en esa dirección.
El equivalente de la derivada en un punto parece ser lo que se llama la diferencial total en ese momento. Si $L$ es el diferencial total en $a \in {\mathrm R}^n$ entonces
$$\lim_{\bf h \to 0} \frac{||f(a + h) - f(a) - L(h)||}{||h||} = 0,$$
donde $||\cdot||$ es la norma euclidiana, lo que significa que $L$ tiene la "propiedad de aproximación" -aproxima la diferencia $f(a + h) - f(a)$ localmente. Si el diferencial total existe, se puede expresar como $L(h) = \nabla{f}(a) \cdot h$ , donde $\cdot$ es el producto punto.
(Creo: el diferencial total no aproximar la función misma - esto se parece a la "derivada de una función en un punto" para las funciones univariantes).
Llego a comprender que el derivada en un punto de una función multivariante puede definirse exactamente igual que la diferencial total en un punto. (Por alguna razón sólo hemos definido la diferencial total para las funciones ${\mathrm R}^n \to {\mathrm R}$ . ¿Esto está relacionado con las matemáticas o es un problema de terminología?)
Cuando intento mirar el derivado $f'$ de la función f Debería ver eso:
- $f': {\mathrm R}^n \to {\mathscr L}(\mathrm{R}^n, \mathrm{R}^m)$ - y lo hago, esto simplemente afirma que la primera derivada en un punto es una aproximación lineal local de la función original f, pero también que
- $f'': {\mathrm R}^n \to {\mathscr L}\Big({\mathrm R}^n, {\mathscr L}({\mathrm R}^n, {\mathrm R}^m)\Big)$ que me está volviendo loco.
Me gustaría preguntar:
- ¿Por qué el diferencial total no se llama simplemente el derivado ?
- ¿Por qué es cierto que $f'': {\mathrm R}^n \to {\mathscr L}\Big({\mathrm R}^n, {\mathscr L}({\mathrm R}^n, {\mathrm R}^m)\Big)$ ? Necesito una forma intuitiva de entender qué es un ${\mathscr L}\Big({\mathrm R}^n, {\mathscr L}({\mathrm R}^n, {\mathrm R}^m)\Big)$ es.
Gracias.