Derivada de una matriz diagonal

Question

Derivada de una matriz diagonal

Preguntado el 7 de Abril, 2021: Cuando se hizo la pregunta
103 visitas: Cuantas visitas ha tenido la pregunta
1 Respuestas: Cuantas respuestas ha tenido la pregunta
Resuelta: Estado actual de la pregunta

Necesito ayuda para tomar la derivada de algunas cantidades con respecto a una matriz diagonal. Digamos que la matriz diagonal es $\boldsymbol{X}_d = \text{diag} \{ x_1, \dots, x_d \}$ (perdón por la anotación). Necesito obtener las siguientes derivadas $\frac{\partial}{\partial \boldsymbol{X}_d} \text{Tr} \{ \boldsymbol{A} \boldsymbol{X}_d \boldsymbol{B} \} \quad \text{and} \quad \frac{\partial}{\partial \boldsymbol{X}_d} \ln | \boldsymbol{A} \boldsymbol{X}_d |.$

Inicialmente, probé ingenuamente las fórmulas para la matriz general, pero después de obtener la estimación de $\boldsymbol{X}_d$ no obtuve una matriz diagonal, lo que no tiene sentido, así que sé que debe haber algo especial con la derivada respecto a una matriz diagonal. No he encontrado muchos recursos sobre este tema, así que quiero publicar la pregunta y obtener ayuda. Por favor, ayúdenme si pueden. Muchas gracias.

Preguntado el 7 de Abril, 2021 por little_sky

Answer 1

1 Respuestas

Answer 2

2voto

greg Puntos 156

$\def\d{{\rm diag}}\def\D{{\rm Diag}}\def\p#1#2{\frac{\partial #1}{\partial #2}}$ Vamos a utilizar dos puntos para denotar el producto traza/Frobenius $\eqalign{ A:B &= {\rm Tr}(A^TB) \;=\; \sum_{j=1}^m\sum_{k=1}^n A_{jk} B_{jk} \\ A:A &= \big\|A\big\|_F^2 \\ }$ En el caso de que $(A,B)$ son vectores, esta definición corresponde al producto punto estándar. La idea clave es que la matriz/vector a cada lado de los dos puntos debe tener las mismas dimensiones.

El producto de Frobenius tiene muchas propiedades interesantes.
En particular, para matrices dimensionalmente compatibles $(A,B,C)$ y el vector $(v)$ $\eqalign{ AB:C &= A:CB^T \\&= B:A^TC \\&= C:AB \\ A:\D(v) &= \d(A):v \\ }$ ${\bf NB}\!:\,$ El operador diag con 'D' mayúscula crea una matriz diagonal a partir de un vector, mientras que el de 'd' minúscula crea un vector a partir de la diagonal de una matriz.

Escribe la primera función en términos de este producto.
A continuación, calcula su diferencial y su gradiente. $\eqalign{ \phi &= (BA):\D(x) \\&= \d(BA):x \\ d\phi &= \d(BA):dx \\ \p{\phi}{x} &= \d(BA) \\ \p{\phi}{X} &= \D\big(\d(BA)\big) = I\odot BA \\ }$ donde $\odot$ denota el producto elemental/Hadamard y $I$ es la matriz de identidad.

Para la segunda función $\,Y=AX\;$ y utilizar Fórmula de Jacobi $\eqalign{ \psi &= \log(\det(Y)) \\ d\psi &= Y^{-T}:dY \\ &= (AX)^{-T}:A\,dX \\ &= A^T(A^{-T}X^{-T}):dX \\ &= X^{-1}:\D(dx) \\ &= \d(X^{-1}):dx \\ \p{\psi}{x} &= \d(X^{-1}) \\ \p{\psi}{X} &= \D\big(\d(X^{-1})\big) = I\odot X^{-1} = X^{-1} \\ }$ desde $X\,\left({\rm and}\,X^{-1}\right)$ ya es una matriz diagonal, el operador Diag no tiene ningún efecto.

Respondido el 7 de Abril, 2021 por greg (156 Puntos )

Derivada de una matriz diagonal

Respuesta

Preguntas Destacadas

Etiquetas mas usadas

i-Ciencias.com

Powered by:

Derivada de una matriz diagonal

Respuesta

Preguntas relacionadas

Preguntas Destacadas

Etiquetas mas usadas

En nuestra red

i-Ciencias.com

Powered by: