5 votos

Cómo llegar a $ \frac{\partial }{\partial X} \log(\mathrm{det}(I + A X B^\top )) = A^\top (I +B X^\top A^\top )^{-1} B$ ?

Estimados expertos en cálculo matricial, por favor, ilumínenme. ¿Cómo se llega a la siguiente derivada matricial?

$$\frac{\partial }{\partial X} \log( \mathrm{det}(I + A X B^\top ) ) = A^\top (I + B X^\top A^\top )^{-1} B$$

Estoy en un estado de confusión con el cálculo matricial porque estoy aprendiendo y no capto del todo el concepto, debo admitirlo. En Wikipedia dice lo siguiente:

A menudo es más fácil trabajar en forma diferencial y luego volver a convertir en derivadas normales.

Mi fuente de confusión comienza desde aquí. Entonces, el diferencial es

$$\mathrm d \log(\det(X)) = \mbox{tr} \left( X^{-1} \mathrm d X \right)$$

¿ahora lo "convertimos" en derivada normal de tal manera que obtenga mi respuesta anterior? :/ Espero que algún día consiga este cálculo matricial. Muchas gracias de antemano.

4voto

greg Puntos 156

En lugar de la función de traza, la notación de producto de traza/Frobenius $$A:B={\rm tr}(A^TB)$$ se presta más fácilmente a las manipulaciones algebraicas.

Empiece con el resultado diferencial que citó, pero en términos de la variable $$Y=(I+AXB^T)$$ en lugar de $X$ . A continuación, cambie la variable de $Y\rightarrow X$ $$\eqalign{ d\log\det Y &= Y^{-T}:dY\cr &= Y^{-T}:A\,dX\,B^T \cr &= A^TY^{-T}B:dX \cr &= A^T(I+BX^TA^T)^{-1}B:dX\cr }$$ Por lo tanto, el gradiente es $$\eqalign{ \frac{\partial\log\det Y}{\partial X} &= A^T(I+BX^TA^T)^{-1}B \cr\cr }$$ Nótese que la propiedad cíclica de la función traza da lugar a muchas formas equivalentes de ordenar los términos en un producto de Frobenius, por ejemplo $$\eqalign{ A:BC &= BC:A \cr &= A^T:(BC)^T \cr &= AC^T:B \cr &= B^TA:C \cr &= B^TAC^T:I \cr &= etc \cr }$$

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X