Tengo una ecuación matricial que produce un escalar
$$f(M) = MAM^T - 2 \sum_i^{N} \log(M_i)$$
Dónde $M$ es un $1 \times N$ vector fila, y $A$ es un $N \times N$ matriz. Como tal, el resultado $f$ es un escalar.
¿Cómo se toma la derivada de $f$ en relación con $M$ ? He visto libro de cocina matrix definen las derivadas de las matrices con valores de índice específicos, pero no pude encontrar una definición de diferenciación con vectores.
Mi intuición es algo así como
$$\frac{\partial f}{\partial M} = 2(AM - M^{\circ -1})$$
con mi razonamiento de que los dos $M$ en el primer término, se obtiene $2AM$ una vez diferenciada, y el término logarítmico da como resultado $M$ donde cada elemento se eleva al $-1$ potencia ( $\frac{d \log x}{dx} = x^{-1}$ ).
De nuevo, no estoy seguro de haber hecho esto correctamente, y el hecho de que $f$ es un escalar lo hace un poco más confuso.
0 votos
¿Qué es? $M_i \,$ ?
1 votos
Creo que en lugar de $2AM$ quieres $AM+A^T M$ a menos que se sepa que A$ es simétrico.
0 votos
Desde $M$ es un vector de filas, el producto $AM$ no existe . Sin embargo, si se cambia ese término por $MA$ entonces su resultado es correcto (suponiendo que $A$ es simétrica).