7 votos

Producto de la regla de la matriz Hessiana

Deje $f: \mathbb{R}^n \to \mathbb{R}$$g: \mathbb{R}^n \to \mathbb{R}$. Hay una fórmula general para la matriz Hessiana de su producto?

Es decir, ¿qué es $H(f(x) g(x))$ donde $H(f(x)) = \left(\frac{\partial^2 f}{\partial x_i \partial x_j}\right)_{i,j = 1 \dots n}$?

5voto

Evan Aad Puntos 2471

Se sigue por el teorema de 40.1(b) en la p. 360 (el producto de la regla) y de corolario 39.7 p. 351 (el diferencial en términos de diferenciales parciales) de Robert G. Bartle "Los Elementos de Análisis Real", 2ª edición (John Wiley & Sons, 1976), que si $n \in \{1, 2, \dots\}$ si $f, g : \mathbb{R}^n \rightarrow \mathbb{R}$ e si $c \in \mathbb{R}^n$ es tal que tanto $f$ $g$ son diferenciables en a$c$,$fg$, asimismo, es diferenciable en a $c$, todas las derivadas parciales de $f$, $g$, y $fg$ están bien definidos en $c$, y el siguiente se tiene: $$ \nabla_c(fg) = (\nabla_cf)g(c) + f(c)\nabla_cg \etiqueta{*} $$ donde $\nabla_cf$ $f$'s de gradiente en $c$ (y de forma análoga $\nabla_cg$$\nabla_c(fg)$). En otras palabras $\nabla_cf$ (y de forma análoga $\nabla_cg$, $\nabla_c(fg)$) es el $n$-dimensiones vector fila, cuyos componentes son $f$'s derivadas parciales en $c$: $$ \nabla_cf = [D_1f(c), \dots, D_nf(c)] $$ (Este gradiente se define en el ejercicio 39.J(a) en p. 357 de Bartle del texto).

Por lo tanto, si $f, g$ son diferenciables en un barrio de $c$ e si $D_1f, D_1g, \dots, D_nf, D_ng$ son todos diferenciable en a $c$, la matriz Hessiana de $fg$ está bien definido a $c$ (y también el de Hesse matrices en $c$ $f$ e de $g$) y su transpuesta es dada por $$\begin{split} H_c(fg)^T & = \left[\begin{array}{c} \nabla_cD_1(fg) \\ \vdots \\ \nabla_cD_n(fg) \end{array}\right] \\ & = \left[\begin{array}{c} \nabla_c\left((D_1f)g + fD_1g\right) \\ \vdots \\ \nabla_c\left((D_nf)g + fD_ng\right) \end{array}\right] \\ & = \left[\begin{array}{c} \nabla_c\left((D_1f)g\right) \\ \vdots \\ \nabla_c\left((D_nf)g\right) \end{array}\right] + \left[\begin{array}{c} \nabla_c\left(fD_1g\right) \\ \vdots \\ \nabla_c\left(fD_ng\right) \end{array}\right] \\ & = \left[\begin{array}{c} \left(\nabla_cD_1f\right)g(c) \\ \vdots \\ \left(\nabla_cD_nf\right)g(c) \end{array}\right] + \left[\begin{array}{c} D_1f(c)\nabla_cg \\ \vdots \\ D_nf(c)\nabla_cg \end{array}\right] + \left[\begin{array}{c} (\nabla_cf)D_1g(c) \\ \vdots \\ (\nabla_cf)D_ng(c) \end{array}\right] + \left[\begin{array}{c} f(c)\nabla_cD_1g \\ \vdots \\ f(c)\nabla_cD_ng \end{array}\right] \\ & = H_cf^Tg(c) + \nabla_cf^T\nabla_cg + \nabla_cg^T\nabla_cf + f(c)H_cg^T \end{split} $$ Es decir, $H_c(fg)$'s de transposición es la vertical de la concatenación de la $n$ gradientes en $c$ de la $n$ derivadas parciales $D_1(fg), \dots, D_n(fg)$, respectivamente. La segunda y cuarta ecuaciones son el resultado de $(*)$ y la tercera es debido a la linealidad de la diferenciación.

La transposición y reordenando los términos, obtenemos $$ H_c(fg) = (H_cf)g(c) + \nabla_cf^T\nabla_cg + \nabla_cg^T\nabla_cf + f(c)H_cg $$

0voto

Steven Lu Puntos 866

Sugerencia: el producto es una función de:

$$P:\Bbb R^2\longrightarrow\Bbb R$$ $$(x,y)\longmapsto xy$$ y su función es una composición $$\Bbb R^n\overset{\Delta}\longrightarrow\Bbb R^n\times\Bbb R^n\overset{(f,g)}\longrightarrow\Bbb R\times\Bbb R\overset{P}\longrightarrow\Bbb R$$ $$x\longmapsto\pmatrix{x\cr x}\longmapsto\pmatrix{f(x)\cr g(x)}\longmapsto f(x)g(x)$$ Aplicar la regla de la cadena dos veces.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X