El libro de cocina de Matrix dice que:
$\frac{\partial}{\partial\mathbf{X}} Tr\{\mathbf{A}\mathbf{X}\mathbf{B}\} = \mathbf{A^T}\mathbf{B^T}$
Parece que no puedo conseguir esto. Ya lo sé:
$\frac{\partial}{\partial\mathbf{X}} Tr\{F(\mathbf{X})\} = f(\mathbf{A}\mathbf{X}\mathbf{B})^T$
Donde $f$ es la derivada escalar de $F$ .
Así que cuando aplico la regla: $\partial \mathbf{XY} = \partial \mathbf{X} \mathbf{Y} + \mathbf{X} \partial \mathbf{Y}$
Yo sí:
Déjalo: $\mathbf{C} = \mathbf{X}\mathbf{B}$
Entonces: $\mathbf{A}\mathbf{X}\mathbf{B} = \mathbf{A}\mathbf{C}$ .
$\frac{\partial}{\partial\mathbf{X}} \mathbf{A}\mathbf{C} = \frac{\partial}{\partial\mathbf{X}} \mathbf{A} \mathbf{XB} + \mathbf{A} \frac{\partial}{\partial\mathbf{X}}\mathbf{X}\mathbf{B} = \mathbf{AB}$
Pero entonces:
$(\mathbf{AB})^{T} = \mathbf{B^TA^T} \neq \mathbf{A^{T}B^{T}}$
¿Estoy confundiendo la noción de derivada escalar y derivada matricial? ¿Cómo puedo verificar la afirmación del Libro de Cocina?