1 votos

Diferenciación de la traza del producto de la matriz cuando los elementos de la matriz son funciones de un vector

Según una fórmula bien conocida (ecuaciones 100-104 aquí )

$$\frac{\partial}{\partial B} tr(AB)=A^T$$

Para matrices cuadradas de valor real $A,B$ . Para simplificar, supongamos que estas matrices son simétricas.

Pero...

1) Diga $A_{ij}=f(x_i, x_j), B_{ij}=g(x_i,x_j)$ donde $x_i, x_j$ son los elementos de un vector real $x$ . ¿Qué pasa entonces con el derivado?

2) ¿Se hace más manejable la situación si supiéramos que $B=A^{-1}\circ C$ (donde " $\circ$ " significa multiplicación hadamard) y que los elementos de $C$ son

$$C_{ij}= \frac{x_i}{A^{-1}_{ij}} \frac{\partial A^{-1}_{ij}}{\partial x_i}$$

(EDIT: En este caso supongo que $B$ probablemente no sea simétrica, ya que $C$ no es simétrica a menos que impongamos una condición que $\frac{\partial A^{-1}_{ij}}{\partial x_i} = \frac{\partial A^{-1}_{ij}}{\partial x_j}$ .)

0 votos

Sólo para comprobar... Todos los $A_{ij}$ dependen de la misma función $f(x,y)$ pero con diferentes variables, precisamente $x_i,y_j$ . ¿Es eso cierto?

0 votos

@mathcounterexamples.net Así es, la misma función. (Su $y_j$ debe ser $x_j$ sin embargo).

0 votos

Hace $A^{-1}$ ¿denota la inversa de Hadamard o la inversa de la matriz regular?

0voto

greg Puntos 156

(1) Supongamos que las matrices $(A,B)$ son funciones de un vector $x$ $$\eqalign{ A &= A(x) &\implies a = {\rm vec}(A) \cr B &= B(x) &\implies b = {\rm vec}(B) \cr }$$ Entonces la función de traza puede escribirse en términos del producto interno (:) de las matrices o de los vectores correspondientes $$\eqalign{ \tau &= {\rm tr}(A^TB) = A:B = a:b }$$ Supongamos que podemos calcular los jacobianos no singulares de las variables vectoriales $$\eqalign{ db &= K\,dx \cr da &= J\,dx \cr &= J(K^{-1}\,db) \cr }$$ Sustitúyelos en la diferencial de la función traza, y encuentra su gradiente respecto a $b$ . $$\eqalign{ d\tau &= a:db + b:da \cr &= a:db + b:JK^{-1}\,db \cr &= a:db + K^{-T}J^Tb:db \cr \frac{\partial\tau}{\partial b} &= a + K^{-T}J^Tb \cr }$$ Vuelve a transformar este resultado en forma de matriz $$\eqalign{ \frac{\partial\tau}{\partial B} &= {\rm Mat}\bigg(\frac{\partial\tau}{\partial b}\bigg) \cr &= {\rm Mat}\Big(a + K^{-T}J^Tb\Big) \cr }$$ Tenga en cuenta que si $A$ es constante, entonces $J=0$ y esta solución se simplifica a $$\eqalign{ \frac{\partial\tau}{\partial B} &= {\rm Mat}\Big(a\Big) = A \cr }$$ como se esperaba.

(2) Para este caso, supongamos que podemos invertir la relación dada $$\eqalign{ A^{-1} &= B\oslash C \cr }$$ y por lo tanto $$\eqalign{ dA^{-1} &= dB\oslash C \cr -A^{-1}\,dA\,A^{-1} &= dB\oslash C \cr dA &= -A(dB\oslash C)A \cr }$$ Ahora encuentra la diferencial y el gradiente de la traza $$\eqalign{ d\tau &= A:dB + B:dA \cr &= A:dB - B:A(dB\oslash C)A \cr &= A:dB - (A^TBA^T)\oslash C:dB \cr \frac{\partial\tau}{\partial B} &= A - (A^TBA^T)\oslash C \cr }$$ donde ( $\oslash$ ) denota una división elemental/Hadamard.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X