3 votos

una cuestión práctica sobre la derivada de la matriz con la inversa y la regla de la cadena: desajuste de dimensiones

Recientemente, estaba tratando de tomar la siguiente derivada $$ \dfrac{\partial (X^TV^{-1}X)^{-1}}{\partial V} $$ Me refería a libro de cocina matrix para resolverlo, donde encontré varias ecuaciones útiles:

La ecuación (59) dice: $$ \dfrac{\partial Y^{-1}}{\partial x} = -Y^{-1}\dfrac{\partial Y}{\partial x}Y^{-1} $$ así que, creo que lo he hecho: $$ \dfrac{\partial (X^TV^{-1}X)^{-1}}{\partial V^{-1}} = -(X^TV^{-1}X)^{-1} X^TX(X^TV^{-1}X)^{-1} $$ y $$ \dfrac{\partial V^{-1}}{\partial V} = -V^{-1}V^{-1} $$ Según la regla de la cadena, debería serlo: $$ \dfrac{\partial (X^TV^{-1}X)^{-1}}{\partial V} =\dfrac{\partial (X^TV^{-1}X)^{-1}}{\partial V^{-1}}\dfrac{\partial V^{-1}}{\partial V} = ((X^TV^{-1}X)^{-1} X^TX(X^TV^{-1}X)^{-1})^T V^{-1}V^{-1} $$

Sin embargo, me encontré con un problema. $V$ es una matriz de tamaño $(n, n)$ y $X$ es una matriz de tamaño $(n, m)$ . Entonces, la primera mitad de la regla de la cadena es de tamaño $(m, m)$ mientras que la segunda mitad de la regla de la cadena es de tamaño $(n, n)$ .

Por favor, ayúdenme a averiguar qué es lo que falla.

Gracias por adelantado.

1voto

lynn Puntos 106

Definamos algunas variables intermedias $$\eqalign{ P &= V^{-1} \cr M &= X^TPX \cr F &= M^{-1} \cr }$$ cuyos diferenciales son $$\eqalign{ dP &= -V^{-1}\,dV\,V^{-1} \cr dM &= X^T\,dP\,X \cr dF &= -M^{-1}\,dM\,M^{-1} \cr }$$ Este último diferencial es el que nos interesa, así que vamos a sustituir sucesivamente las variables hasta llegar a $V$ $$\eqalign{ dF &= -M^{-1}\,dM\,M^{-1} \cr &= -M^{-1}\,(X^T\,dP\,X)\,M^{-1} \cr &= -M^{-1}\,X^T\,(-V^{-1}\,dV\,V^{-1})\,X\,M^{-1} \cr &= M^{-1}\,X^T\,V^{-1}\,dV\,V^{-1}\,X\,M^{-1} \cr &= F\,X^T\,V^{-1}\,dV\,V^{-1}\,X\,F \cr }$$ Llegados a este punto, sigamos la prescripción de Magnus y Neudecker para tratar las derivadas matriz a matriz, y vectoricemos ambos lados $$\eqalign{ d{\rm vec}(F) &= (V^{-1}\,X\,F)^T\otimes(F\,X^T\,V^{-1})\,d{\rm vec}(V) \cr }$$ Lo que puede ser reordenado al resultado de aspecto convencional $$\eqalign{ \frac{\partial f}{\partial v} &= (V^{-1}\,X\,F)^T\otimes(F\,X^T\,V^{-1}) \cr }$$

0voto

callculus Puntos 6878

No veo cómo la ecuación (59) podría ayudar. $V$ no depende de $X$ .

Si $X$ es una matriz cuadrada, entonces $\left(X^TV^{-1}X \right)^{-1}=X^{-1}V\left(X^{-1}\right)^T$

Dejemos que $X^{-1}=A$ . Obtenemos $AVA^T$

Puedes ver ici (página 9) que $$\frac{\partial AVA^T}{\partial V}= AA^T$$

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X