12 votos

El hessiano del determinante

Es bien sabido cómo tomar la derivada del determinante: sea $A(s)$ sea una familia de matrices cuadradas suavemente parametrizadas por la variable $s$ (en otras palabras, $A:\mathbb{R}\to \mathbb{R}^{N^2}$ es una curva suave). Entonces la derivada del determinante puede venir dada por

$$ \frac{d}{ds} \det A(s) = \operatorname{Tr} \left(\tilde{A}(s) A'(s)\right)$$

donde $A'(s) = \frac{d}{ds}A(s)$ y $\tilde{A}(s)$ es la matriz adjunta de $A(s)$ . La fórmula anterior también se generaliza al caso de que $A:\mathbb{R}^d\to \mathbb{R}^{N^2}$ es un liso, $d$ -familia de matrices cuadradas.

Por otro lado, no he encontrado una expresión agradable para la segunda derivada (hessiana) del determinante de dicha familia. Sólo usando la regla de Leibniz, un término es obvio: $\operatorname{Tr}\left(\tilde{A}(s) A''(s)\right)$ . Sin embargo, no conozco ninguna expresión agradable de la derivada de la adjunta. Evaluando la componente adjunta, vemos que debe ser lineal en $A'(s)$ .

Así que la pregunta es: ¿alguien conoce una forma bonita para presentar la derivada de la matriz adyuvada, o una forma bonita para presentar el hessiano del determinante?

Para mi propósito, una respuesta a la siguiente forma más débil del problema también sería satisfactoria:

Dejemos que $A:\mathbb{R}^d\to \mathbb{R}^{N^2}$ sea una suave $d$ -familia de parámetros de simétrico matrices. Supongamos que $\det(A(0)) = 0$ . Ahora bien, si sabemos que el núcleo de $A(0)$ como dimensión al menos 2, entonces por un argumento de diagonalización, la matriz adjunta $\tilde{A}(0)$ debe desaparecer idénticamente. Y por lo tanto el hessiano está determinado por el término con la derivada del adjunto. Entonces, bajo los supuestos de que $d \geq 2$ y $A(0)$ tiene una nulidad de al menos 2: (a) ¿es posible que el hessiano no sea degenerado? (b) Si es así, ¿cuáles son algunas condiciones suficientes para garantizar la no-degeneración?

(En el caso $d = 1$ está claro que el "hessiano" puede ser no degenerado, simplemente tomando $N = 2$ y $A(s) = s I$ .)

5voto

riza Puntos 170

No estoy seguro de que sea una forma tan "bonita" como la que tenías en mente, pero es bastante sencilla (conceptualmente, aunque quizá no simbólicamente). Sólo tienes que escribir la matriz adjunta como una matriz de determinantes de $A$ es decir, los cofactores. $ \tilde{A} = [ \det M_{kl} ] $ y luego aplica la misma regla que usaste la primera vez. Por lo tanto, si

$$ \frac{\partial}{\partial x_i} \det A = \mathrm{Tr}\left( [ \det M_{kl} ] \frac{\partial A}{\partial x_i} \right)$$

entonces

$$ \frac{\partial^2}{\partial x_i \partial x_j} \det A = \mathrm{Tr}\left( \tilde{A} \frac{\partial^2 A}{\partial x_i \partial x_j} + \left[ \mathrm{Tr}\left( \tilde{M}_{kl} \frac{\partial M_{kl}}{\partial x_j} \right) \right]_{kl} \frac{\partial A}{\partial x_i} \right) $$

Nótese que esta expresión incluye las matrices adjuntas de las matrices cofactoras. Como indica el subíndice, los índices $ k $ y $ l $ se mantienen constantes dentro de los corchetes.

Por lo tanto, la respuesta a tu pregunta (a) es "sí, es posible que el hessiano sea no degenerado" y, en cuanto a (b), calcular y luego articular las condiciones suficientes seguiría siendo un problema bastante complicado dada la complejidad de esta fórmula.

1voto

rck Puntos 121

Para aplicar lo que anon escribió : toma una base en la que $A(0)$ se diagonaliza.

Entonces es fácil comprobar que $\partial \tilde{A}_{ij} = \partial \det A_{\hat{i}\hat{j}}$ donde $A_{\hat{i}\hat{j}}$ es la submatriz con el $i$ la fila y $j$ La columna de la derecha ha sido derribada. Usando que al menos dos de $A(0)$ son 0, vemos que para $i\neq j$ , $A_{\hat{i}\hat{j}}$ tiene un rango máximo de $N-2$ , por lo que tiene adyuvante de desvanecimiento, y por lo que $\partial\tilde{A}_{ij} = 0$ .

En otras palabras, $\partial\tilde{A}(0)$ sigue siendo una matriz diagonal. Ahora, si la nulidad de $A(0)$ es estrictamente mayor que 2, entonces cualquier submatriz $A_{\hat{i}\hat{j}}$ tiene una nulidad de al menos 2, y por lo tanto $\partial \tilde{A}(0) = 0$ . Y en este caso $\partial^2 \det A (0) = 0$ .

Limitarse al caso $A$ tiene rango $N-2$ podemos suponer sin pérdida de generalidad que $A_{11}(0) = A_{22}(0) = 0$ . Entonces tenemos que para $i > 2$ , $\partial\tilde{A}_{ii}(0) = 0$ de nuevo.

Informática $\partial\tilde{A}_{11}$ vemos que es igual a $$ \partial \det A_{\hat{1}\hat{1}}(0) = \partial A_{22}\prod_{i = 3}^N A_{ii}(0) $$

Así que de hecho tenemos en este caso $$ \partial^2_{\mu\nu} \det A(0) = (\partial_{\mu} A_{11} \partial_\nu A_22 + \partial_\nu A_{22} \partial_\mu A_{11}) \prod_{i = 3}^N A_{ii} $$ que en realidad responde completamente a la versión débil de mi pregunta.

Obsérvese que por la fórmula anterior, el hessiano de dicha matriz determinante es de rango como máximo 2. Por tanto, si la dimensión $d\geq 3$ el hessiano debe ser degenerado (determinante 0). Si $d = 1$ la condición necesaria y suficiente para que el hessiano no sea degenerado es que $A_{11}'A_{22}' \neq 0$ . En el caso $d = 2$ la condición necesaria y suficiente para que el hessiano no sea degenerado es que $\nabla A_{11}$ y $\nabla A_{22}$ son ambos no evanescentes, y son linealmente independientes.


Para la pregunta del título, en el caso de que $\det A \neq 0$ El comentario de Yoyo es una buena descripción. Escribir $\tilde{A} = (\det A) A^{-1}$ En realidad, podemos derivar

$$ \partial^2_{\mu\nu} \det(A) = \operatorname{Tr} (\tilde{A}\partial^2_{\mu\nu}A) + \frac{1}{\det A} \left( \operatorname{Tr} X_\mu \operatorname{Tr} X_\nu - \operatorname{Tr}(X_\mu X_\nu)\right) $$

donde $X_\mu = \tilde{A}\partial_\mu A$ .

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X