La matriz Jacobiana es la mejor aproximación lineal a $f$ a un punto en particular. Sin embargo, si cambia el punto, es diferente Jacobiana. La segunda derivada se cuantifica cómo el Jacobiano cambios como el punto de aproximación a los cambios - el "cambio del cambio".
Para ello, podemos pensar en un derivado $D$ como una asignación en el dominio de la función original para el espacio de lineal mapas de $\mathcal{L}(X,Y)$ dominio $X$ y el rango de $Y$ el mismo que el original de la función:
\begin{align}
f:& X \rightarrow Y \\
Df:& X \rightarrow \mathcal{L}(X,Y)
\end{align}
La derivada de $f$, $Df$, es una función en la que pones en un punto y se le da una función lineal,
$$Df(x_0) = \text{best linear function approximating $f$ near }x_0.$$
En la forma de la matriz, $Df(x_0)$ es la matriz Jacobiana $J$ a $x_0$: $Df(x_0)(y) = J|_{x_0} y$.
Desde $Df$ es en sí misma una función, podemos tomar es derivado, y así sucesivamente, obteniendo una torre de más y más alto derivados de la siguiente manera:
\begin{align}
f:&\mathbb{R}^n \rightarrow \mathbb{R}^m \\
Df:&\mathbb{R}^n \rightarrow \mathcal{L}(\mathbb{R}^n, \mathbb{R}^m) \\
D(Df) = D^2f:&\mathbb{R}^n \rightarrow \mathcal{L}(\mathbb{R}^n, \mathcal{L}(\mathbb{R}^n, \mathbb{R}^m)) \\
D(D^2f) = D^3f:&\mathbb{R}^n \rightarrow \mathcal{L}(\mathbb{R}^n,\mathcal{L}(\mathbb{R}^n, \mathcal{L}(\mathbb{R}^n, \mathbb{R}^m))) \\
\dots
\end{align}
Ahora esto se vuelve confuso rápido (espacios lineales, mapas de asignación de espacios lineales, mapas de asignación de... ack!!). Por suerte hay un isomorfismo isométrico teorema de decir que todo se reduce a multilineal mapas:
$$\mathcal{L}^n(X,\mathcal{L}^m(X,Y)) \cong \mathcal{L}^{n+m}(X,Y),$$
donde $\mathcal{L}^k(X,Y)$ es el espacio de la $k$-lineal mapas de$X$$Y$, e $\cong$ denota una isométrica isomorfismo de espacios de funciones. En más detalle, lo que significa para $g$ $\mathcal{L}^k(X,Y)$ es que el $g : X \times \dots \times X \rightarrow Y$, e $g$ es independiente lineal en cada uno de sus entradas:
$$g(x_a + x_b,z,w) = g(x_a,z,w) + g(x_b,z,w),$$
$$g(x,y_a+y_b,w) = g(x,y_a,w) + g(x,y_b,w),$$
y así sucesivamente.
Por lo tanto, ahora podemos simplificar nuestra torre de derivados de la utilización de espacios de funciones multilineales:
\begin{align}
f:&\mathbb{R}^n \rightarrow \mathbb{R}^m \\
Df:&\mathbb{R}^n \rightarrow \mathcal{L}(\mathbb{R}^n, \mathbb{R}^m) \\
D^2f:&\mathbb{R}^n \rightarrow \mathcal{L}^2(\mathbb{R}^n, \mathbb{R}^m) \\
D^3f:&\mathbb{R}^n \rightarrow \mathcal{L}^3(\mathbb{R}^n, \mathbb{R}^m) \\
\dots
\end{align}
Así, a partir de esta imagen es bastante clara cuál es la derivada segunda de la función de $f:X \rightarrow Y$ está en un punto. Es un bilineal mapa de$X \times X$$Y$. Poner en dos vectores de $X$, y se da un vector en $Y$, y lo hace de una manera que es lineal en cada entrada de forma independiente.
Si usted tiene una base $\{ b_i\}$ $n$ vectores para $X$ y $\{e_i\}$ $m$ vectores para $Y$, se puede caracterizar completamente la segunda derivada por un 3D $n$a$n$a$m$ matriz de números de $T_{ijk}$ cuando la $(i,j,k)$'th entrada se encuentra aplicando la función bilineal con $b_i$ en el primer argumento y $b_j$ en el segundo argumento, y luego tomar la componente del vector que sale en el $e_k$ dirección:
$$T_{ijk} = e_k^T D^2f(x_0)(b_i,b_j).$$