4 votos

¿Cómo es la derivada de una función $V : \mathbb{R}^{n\times n} \mapsto \mathbb{R}$ definido?

Específicamente, estoy considerando la función $$ V(\mathbf{X}) = -\ln \det \mathbf{X}\,. $$ Después de un ejercicio, he sido capaz de demostrar que $$ V(\mathbf{X}+\varepsilon\mathbf{Y}) = V(\mathbf{X})-\varepsilon\,\text{tr}\,\mathbf{X}^{-1}\mathbf{Y}+O(\varepsilon^2)\,. $$ (tr es la traza.) A continuación, el texto dice que esto es equivalente a decir $$ -\nabla V = (\mathbf{X}^{-1})^T\,. $$ Al parecer, uno podría llegar tomando la ecuación anterior y transformarla en $$ \begin{split} \frac{V(\mathbf{X}+\varepsilon\mathbf{Y})-V(\mathbf{X})}{\varepsilon} = \end{split}-\text{tr}\,\mathbf{X}^{-1}\mathbf{Y}+O(\varepsilon)\,. $$ La derivada en la "dirección" $\mathbf{Y}$ es entonces, presumiblemente, dada dejando $\varepsilon \rightarrow 0$, produciendo $-\text{tr}\,\mathbf{X}^{-1}\mathbf{Y}$. Pero no veo la manera de que se recupere la ecuación $$ -\nabla V = (\mathbf{X}^{-1})^T\,. $$

2voto

Rob Dickerson Puntos 758

Confuso que importa aquí es que usted está pidiendo a los "derivados", por un lado (que se podría referir a cualquier de varios conceptos relacionados al hacer el cálculo en las dimensiones superiores) y escribir $\nabla V$, la notación habitual de gradiente, en el otro lado.

Podemos empezar por calcular el diferencial de $dV$, cuya definición es menos controvertido: el lineal mapa de vectores de tangentes en $\mathbb{R}^{n\times n}$ que calcula la derivada direccional de $V$ en las direcciones $\delta X$:

$$[dV(X)](\delta X) = \lim_{\epsilon\to 0} \frac{d}{d\epsilon} V(X+\epsilon\delta X).$$

Ya has calculado $[dV(X)](\delta X) = -\operatorname{tr}(X^{-1}\delta X).$ Esto debe ser una función lineal de la $\delta X$, lo que puede no ser inmediatamente evidentes a partir de la fórmula, pero se hace más evidente si tenemos en reescribir la traza como Frobenius producto, $$[dV(X)](\delta X) = -X^{-T} : \delta X.$$

Ahora, para llegar desde el diferencial a un gradiente, necesitamos un producto interior $\langle M, N\rangle$ en el espacio de la tangente de $\mathbb{R}^{n\times n}$. Dado un producto interior, el gradiente de la $V$ $X$ se define como el vector $\nabla V$ que satisface $$\langle \nabla V(X), \delta X\rangle = [dV(X)](\delta X)$$ para todos los $\delta X$.

Observe que a diferencia de la diferencial, un gradiente requiere, depende de la elección del producto interior sobre los vectores de tangentes. Al hacer el cálculo en $\mathbb{R}^n$ nosotros generalmente (pero no siempre; a veces en la física del producto interior implica masas, etc) recoger el producto escalar como el interior del producto. A lo largo de líneas similares, si elegimos la Frobenius interior del producto como el producto interior en $\mathbb{R}^{n\times n}$, tenemos que $$\nabla V = -X^{-T}.$$

1voto

Studer Puntos 1050

Tenga en cuenta que a priori la igualdad de su pasada no puede ser correcta, puesto que el derivado es una transformación lineal $\mathbb R^{n\times n}\to\mathbb R$.

Lo que pasa es que uno puede demostrar que cualquier funcional lineal $\mathbb R^{n\times n}\to\mathbb R$ es de la forma $$A\longmapsto\operatorname{Tr}(B^TA)$$ for some $B\in \mathbb R ^ {n\times n}$. It is natural and common to identify the above map with $B$, and thus we have an isomorphism between $\mathbb R ^ {n\times n} $ y su dual.

Es con este punto de vista que la igualdad de su pasada tiene sentido.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X