Es evidente que el cálculo es casi inviable. En particular, la respuesta de GMB es absolutamente falsa (véase mi comentario anterior). ¿Quién ha dado un buen punto a su respuesta? Sin embargo, se puede dar una respuesta compacta si $X=A^{-1}$ porque $D\log_I=id$ .
Sea $f(X)=tr(B\log(XA))$ . Entonces $Df_{A^{-1}}:H\rightarrow tr(BHA)$ . Así $\nabla (f)_{A^{-1}}=(AB)^T$ .
EDITAR: Que $h(X)=tr(\log(I+X))$ donde $\log$ denota el logaritmo principal y $||X||<1$ . Entonces $h(X)=tr(\sum_{k=1}^{\infty}(-1)^{k+1}/k.X^k) =\sum_{k=1}^{\infty}(-1)^{k+1}/k.tr(X^k)$ y $Dh_X:H\rightarrow \sum_{k=1}^{\infty}(-1)^{k+1}/k.tr(kX^{k-1}H)$ (porque $tr(UV)=tr(VU)$ ) $=tr(\sum_{k=1}^{\infty}(-1)^{k-1}X^{k-1}H)=tr((I+X)^{-1}H)$ . En otras palabras $\nabla(h)_X={(I+X)^{-1}}^T$ . En términos más generales, si $X$ no tiene valores propios en $\mathbb{R}^-$ entonces $g(X)=tr(\log(X))$ . Uno tiene $Dg_X:H\rightarrow tr(X^{-1}H)$ y $\nabla(g)_X={X^{-1}}^T$ .
Aquí $f(X)=tr(B\log(XA))=tr(B\log(Y))$ entonces debemos derivar $u(Y)=tr(BY^k)$ . Por desgracia, $Du_Y:K\rightarrow tr(B(kY^{k-1})K)$ es falsa en general ; sin embargo, es verdadera si, por ejemplo, $BY=YB$ . Por último, cuando $BXA=XAB$ , $Df_X:H\rightarrow tr(B(XA)^{-1}HA)$ (porque $K=HA$ ) $=tr((XA)^{-1}BHA)=tr(X^{-1}BH)$ y $\nabla(f)_X=(X^{-1}B)^T$ no depende de $A$ .
0 votos
¿Conoces la regla de la cadena y la regla del producto?
0 votos
Por supuesto en el caso escalar, pero me queda una duda: ¿estas reglas son aplicables sin cambios también en el caso matricial? ¿Y el orden de derivación en este último caso? Gracias