4 votos

derivada del exponencial de la traza de la matriz

¿Cuál es la derivada de $\sum_{ij}e^{-d_{ij}^2(X)}=\sum_{ij}e^{-\operatorname{tr}(X^TC_{ij}X)}$ con respecto a $X$ donde $C_{ij}$ es una matriz constante y $d_{ij}^2(X)$ denota la distancia euclidiana al cuadrado entre las filas $i,j$ de $X$ . Todas las entradas aquí son reales

1voto

RobH Puntos 2136

Bien. No cambia mucho de todos modos. Utiliza la linealidad del trazado. Escribiendo $f(X) = {\rm tr}(X^T C_{ij} X)$ y variando $X$ por $\delta X$ obtenemos $f(X+\delta X) - f(X) = {\rm tr}(\delta X^T C_{ij} X) + {\rm tr}(X^T C_{ij} \delta X)$ . Ahora utiliza lo que sabes sobre cómo se transforman las trazas de las matrices bajo la transposición del argumento y también lo que sabes sobre la forma de $C_{ij}$ para simplificar esa expresión y luego dar la derivada matricial de $g(X)$ .

¿Qué pasa con la derivada de $g(X) = \exp f(X)$ ? Desde $f$ mapea vectores a números reales, puedes usar la conocida regla de composición en la exponenciación.

Es posible que su expresión de $C_{ij}$ saca los componentes de $X$ . ¿Qué hace la suma final sobre $i$ y $j$ ¿hacer?

0voto

Spencer Puntos 48

¡Usuario, la imagen de la derivada es un escalar ! Supongamos que las matrices son reales. Además, la $(C_{i,j})$ son matrices simétricas. Entonces la derivada requerida es $H\rightarrow -2\sum_{i,j}Trace(X^TC_{i,j}H)exp(-Trace(X^TC_{i,j}X))$ .

0voto

Keith Puntos 31

Consideremos la función escalar $$ \eqalign{ f_{ij} &= {\rm exp}(-C_{ij}:XX^T)\cr }$$ Su función objetivo es simplemente la suma de estas funciones: $\,\,f=\sum_{ij}f_{ij}$

A continuación, consideremos la diferencial del logaritmo de una de estas funciones escalares $$ \eqalign{ {\rm log}(f_{ij}) &= -C_{ij}:XX^T \cr d\,{\rm log}(f_{ij}) &= -C_{ij}:d\,(XX^T) \cr \frac {df_{ij}}{f_{ij}} &= -C_{ij}:d\,(XX^T) \cr &= -2\,C_{ij}\,X:dX \cr df_{ij} &= -2\,f_{ij}\,C_{ij}\,X:dX \cr \frac {\partial f_{ij}}{\partial X} &= -2\,f_{ij}\,C_{ij}\,X \cr }$$ La derivada de la función objetivo es la suma de estas derivadas $$ \eqalign{ \frac {\partial f}{\partial X} &= -2\,\sum_{ij} \,f_{ij}\,C_{ij}\,X \cr }$$ Puede sumar las cantidades indexadas y reunirlas en una única matriz $M = \sum_{ij} \,f_{ij}\,C_{ij}$ . Ahora se puede escribir la derivada como $\,\,\frac {\partial f}{\partial X} = -2MX$

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X