1 votos

Derivada de AXB con respecto a X

Supongamos que $A\in\mathbb{R}^{m\times m}$ y $B\in\mathbb{R}^{n\times n}$ son dos matrices constantes. ¿Cómo puedo encontrar la derivada parcial de $AXB$ con respecto a $X$ en el que $X\in\mathbb{R}^{m\times n}$ ? De hecho, ¿cómo calcular $$\frac{\partial(AXB)}{\partial X}.$$

Creo que es fácil ver que $$\mathrm{vec}(AXB)=(B^T\otimes A)\mathrm{vec}(X),$$ donde la notación $\otimes$ denota el producto de Kronecker, y $\mathrm{vec}(X)$ es la vectorización de la matriz $X$ . Por lo tanto, tenemos $$\frac{\partial ((B^T\otimes A)\mathrm{vec}(X))}{\partial \mathrm{vec}(X)}=B^T\otimes A.$$ Aquí, no puedo entender cuál es la relación entre $\frac{\partial(AXB)}{\partial X}$ y $\frac{\partial ((B^T\otimes A)\mathrm{vec}(X))}{\partial \mathrm{vec}(X)}$ ?

Muchas gracias por la ayuda.

1voto

Al vectorizar el $m\times n$ matriz $X$ se obtiene un vector $v =\mathrm{vec}(X)$ cuyo $i$ viene dado por $v_i = X_{i\%m, i//m+1},$ donde $i//m$ es la división entera y $i\%m$ es el resto de la división entera.

Ahora considere lo que quiere decir con $$\frac{\partial AXB}{\partial X},$$ Estás tomando la derivada de un objeto con dos índices con respecto a un objeto con dos índices, por lo que estás considerando todos los términos de la forma $$\frac{\partial [AXB]_{i,j}} {\partial X_{k,l}},$$ la matriz derivada vectoriza esta indexación a lo largo de dos índices, la fila es la posición a lo largo de $i,j$ la columna es la posición a lo largo de $k,l$ Así que $$ \frac{\partial [AXB]_{i,j}} {\partial X_{k,l}}= (B\otimes A)_{m(j-1)+i, m(l-1)+k},$$ donde la indexación invierte la operación de vectorización.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X