Recientemente, estaba tratando de tomar la siguiente derivada $$ \dfrac{\partial (X^TV^{-1}X)^{-1}}{\partial V} $$ Me refería a libro de cocina matrix para resolverlo, donde encontré varias ecuaciones útiles:
La ecuación (59) dice: $$ \dfrac{\partial Y^{-1}}{\partial x} = -Y^{-1}\dfrac{\partial Y}{\partial x}Y^{-1} $$ así que, creo que lo he hecho: $$ \dfrac{\partial (X^TV^{-1}X)^{-1}}{\partial V^{-1}} = -(X^TV^{-1}X)^{-1} X^TX(X^TV^{-1}X)^{-1} $$ y $$ \dfrac{\partial V^{-1}}{\partial V} = -V^{-1}V^{-1} $$ Según la regla de la cadena, debería serlo: $$ \dfrac{\partial (X^TV^{-1}X)^{-1}}{\partial V} =\dfrac{\partial (X^TV^{-1}X)^{-1}}{\partial V^{-1}}\dfrac{\partial V^{-1}}{\partial V} = ((X^TV^{-1}X)^{-1} X^TX(X^TV^{-1}X)^{-1})^T V^{-1}V^{-1} $$
Sin embargo, me encontré con un problema. $V$ es una matriz de tamaño $(n, n)$ y $X$ es una matriz de tamaño $(n, m)$ . Entonces, la primera mitad de la regla de la cadena es de tamaño $(m, m)$ mientras que la segunda mitad de la regla de la cadena es de tamaño $(n, n)$ .
Por favor, ayúdenme a averiguar qué es lo que falla.
Gracias por adelantado.