7 votos

Doble derivada del compuesto de funciones

Considere $f:\mathbb{R}^n\rightarrow\mathbb{R}^m$ y $g:\mathbb{R}^m\rightarrow\mathbb{R}^k$ . Entonces $(g\circ f):\mathbb{R}^n\rightarrow\mathbb{R}^k$ y, si ambos son diferenciables, $[D(g\circ f)_p]=(Dg)_{f(p)}\cdot (Df)_p$ . Si estas funciones son dos veces diferenciables, entonces

$D(D(g\circ f))_p=(D^2g)_{f(p)}\cdot (Df)^2_p + (Dg)_{f(p)}\cdot (D^2 f)_p$ .

Estoy tratando de averiguar qué $(Df)^2_p$ medios. Dado que se trata de un $m\times n$ matriz no puedo multiplicarlos. ¿Puede alguien ayudarme?

4voto

seanyboy Puntos 3170

Dejemos que $p = (x_1,\ldots,x_m)$ , $f(p) = (y_1,\ldots,y_n)$ y $(g\circ f)(p)= (z_1,\ldots,z_k)$ . Entonces la regla de la cadena se puede escribir $$ \frac{\partial z_j}{\partial x_i} \;=\; \sum_{\alpha=1}^m \frac{\partial z_j}{\partial y_\alpha} \frac{\partial y_\alpha}{\partial x_i} $$ Lo que ha escrito como $(Dg)_{f(p)}$ es la matriz de derivadas parciales $\dfrac{\partial z_j}{\partial y_\alpha}$ y lo que ha escrito como $(Df)_p$ es la matriz de derivadas parciales $\dfrac{\partial y_\alpha}{\partial x_i}$ .

Tomando de nuevo la derivada se obtiene $$ \frac{\partial^2 z_j}{\partial x_h \partial x_i} \;=\; \sum_{\alpha=1}^m\sum_{\beta=1}^m \frac{\partial^2 z_j}{\partial y_\beta\partial y_\alpha}\frac{\partial y_\beta}{\partial x_h}\frac{\partial y_\alpha}{\partial x_i}\;+\;\sum_{\alpha=1}^m \frac{\partial z_j}{\partial y_\alpha}\frac{\partial^2 y_\alpha}{\partial x_h \partial x_i} $$ Lo que ha escrito como $(D^2g)_{f(p)}$ es el rango tres $k\times m\times m$ tensor de segundas derivadas parciales $\dfrac{\partial^2 z_j}{\partial y_\beta \partial y_\alpha}$ . Como puede ver, lo que ha escrito como $(Df)_p^2$ es el rango cuatro $m\times n\times m\times n$ tensor cuyas entradas son $\dfrac{\partial y_\beta}{\partial x_h}\dfrac{\partial y_\alpha}{\partial x_i}$ . Es decir, $(Df)_p^2$ es el producto tensorial (o Producto Kronecker ) de la matriz $(Df)_p$ con ella misma.

En general, dada una $m\times n$ matriz $A$ y un $q\times r$ matriz $B$ Su producto tensorial es el $m\times n\times q \times r$ cuyo tensor $(i,j,k,\ell)$ -la quinta entrada es $a_{i,j}b_{k,\ell}$ . Esta operación es análoga a la producto exterior de dos vectores. Más generalmente, es posible tomar el producto tensorial de cualquier rango $R$ tensor con cualquier rango $S$ para obtener un tensor de rango $R+S$ .

Desde un punto de vista más algebraico, $(Df)_p$ es una transformación lineal de $\mathbb{R}^n$ a $\mathbb{R}^m$ y la segunda derivada $(D^2f)_p$ es una tranformación lineal $$ (D^2f)_p : \mathbb{R}^n\otimes\mathbb{R}^n \to \mathbb{R}^m $$ donde $\otimes$ denota el producto tensorial de espacios vectoriales . El objeto $(Df)_p^2$ es la transformación lineal $$ (Df)_p^2 : \mathbb{R}^n\otimes\mathbb{R}^n \to \mathbb{R}^m\otimes\mathbb{R}^m $$ definido por $$ (Df)_p^2(v\otimes w) \;=\; (Df)_p(v) \,\otimes\, (Df)_p(w) $$ Desde $(D^2g)_{f(p)}$ va de $\mathbb{R}^m \otimes \mathbb{R}^m$ a $\mathbb{R}^k$ la composición $(D^2g)_{f(p)}\cdot (Df)_p^2$ está definida, y es una transformación lineal de $\mathbb{R}^n\otimes\mathbb{R}^n$ a $\mathbb{R}^k$ .

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X