Fórmula de derivación matriz a matriz

Question

Fórmula de derivación matriz a matriz

Preguntado el 21 de Junio, 2016: Cuando se hizo la pregunta
171 visitas: Cuantas visitas ha tenido la pregunta
3 Respuestas: Cuantas respuestas ha tenido la pregunta
Resuelta: Estado actual de la pregunta

Necesito derivar $\frac{\delta(X^{T}MX)}{\delta X}$ , donde $X$ y $M$ son $n \times n$ matrices.

Sé que $\frac{\delta(AXB)}{\delta X}=B^{T} \otimes A$ pero estoy teniendo dificultades para derivar lo que necesito de eso o desde cero.

Preguntado el 21 de Junio, 2016 por Luke P M

1 votos

Si $A$ es un vector de filas y $B$ es un vector columna, entonces $AXB$ es un escalar. Por lo tanto, $(AXB)/X$ debe ser un $n \times n$ matriz. Sin embargo, $B^T \otimes A$ es un vector de filas. Algo no está bien. La derivada es en realidad $A^T B^T$ .

Comentado el 21 de Junio, 2016 por Rodrigo de Azevedo

1 votos

Está siguiendo la convención Magnus-Neudecker, en la que se vectoriza todo.

Comentado el 21 de Junio, 2016 por lynn

Answer 1

3 Respuestas

Answer 2

7voto

frank Puntos 51

Empezar con una función matricial, luego tomar la diferencial, luego vectorizar e identificar el gradiente.

$\eqalign{ F &= X^TMX \cr dF &= dX^TMX + X^TMdX \cr {\rm vec}(dF) &= {\rm vec}(dX^TMX) + {\rm vec}(X^TMdX) \cr df&=(X^TM^T\otimes I){\rm vec}(dX^T) + (I\otimes X^TM){\rm vec}(dX)\cr &= \Big((X^TM^T\otimes I)K + (I\otimes X^TM)\Big)\,{\rm vec}(dX) \cr \frac{\partial f}{\partial x} &= (X^TM^T\otimes I)K + (I\otimes X^TM) \cr }$ donde $K$ es el Matriz de conmutación para los productos de Kronecker.

Respondido el 21 de Junio, 2016 por frank (51 Puntos )

Answer 3

5voto

Josh Puntos 121

Dejemos que $f(X) = X^T M X$ . Entonces, para una variación $\epsilon Y$ con $\epsilon$ un número real, tenemos por cálculo directo $f(X+\epsilon Y) = f(X) + \epsilon \left( Y^T M X + X^T M Y \right) + \epsilon^2 \left( Y^T M Y \right)$ Por lo tanto, podemos calcular la derivada direccional como sigue: $\nabla_Y f(X) := \lim_{\epsilon \to 0} \frac{f(X+\epsilon Y)-f(X)}{\epsilon} = Y^T MX + X^T M Y.$ Por lo tanto, la derivada $\nabla f$ en $X$ es el mapa lineal $\nabla f(X): Y \mapsto Y^T M X + X^T M Y$

Respondido el 21 de Junio, 2016 por Josh (121 Puntos )

Answer 4

3voto

azerttyu Puntos 21

$\Phi: M_n \times M_n \to M_n$ dado por $\Phi(X,Y) = X^T M Y$ es una forma bilineal en un nvs de dimensión finita, por lo que $\Phi$ está acotado. Por lo tanto, $\Phi$ es diferenciable y:

$D \Phi(X,Y)(H,K) = \Phi(H,Y) + \Phi(X,K) = H^T M Y + X^T M K$

para todos $X,Y,H,K \in M_n$ .

Dejemos que $q: M_n \to M_n$ , $q(X) = \Phi(X,X)$ . Entonces, $q$ es diferenciable y para todo $X, H \in M_n$ ,

$Dq(X)H = D\Phi(X,X)(H,H) = H^T M X + X^T M H$

Respondido el 21 de Junio, 2016 por azerttyu (21 Puntos )

Fórmula de derivación matriz a matriz

Respuestas

Preguntas Destacadas

Etiquetas mas usadas

i-Ciencias.com

Powered by:

Fórmula de derivación matriz a matriz

Respuestas

Preguntas relacionadas

Preguntas Destacadas

Etiquetas mas usadas

En nuestra red

i-Ciencias.com

Powered by: