Deje $\vec{b}=\langle b_1,\dots,b_n\rangle ^T$ ser un n-dimensional vector de coeficientes. Deje $\vec{x}_1,\dots,\vec{x}_n$ ser $n$ $p$-dimensiones de los vectores. Deje $G(\vec{b})=\log\det\left( \sum_{i=1}^n b_i \vec{x}_i\vec{x}_i^T\right)$.
Deje $A=\sum_{i=1}^n b_i \vec{x}_i\vec{x}_i^T$. Si uno quiere calcular el $i$-ésimo componente de la pendiente, obtenemos
\begin{eqnarray} \nabla_i G(\vec{b}) &=& \text{Tr}\left(\partial_i A \right) \\ &=& \text{Tr}\left( A^{-1} \vec{x}_i\vec{x}_i^T \right) \\ &=& \text{Tr}\left(\vec{x}_i^T A^{-1} \vec{x}_i \right) \\ &=& x_i^T A^{-1} x_i \end{eqnarray}
Yo soy de llenar los detalles hasta la fecha de este documento (página 19, antes de la ecuación (33)). Tan lejos estoy de acuerdo con su cálculo. Sin embargo, no entiendo su cálculo de la línea (33) y (34) en el que se calcula el estado de Hesse.
Afirman que $$ \nabla^2_{ij} (G(\vec{b})) = -(\vec{x}_i^T^{-1}\vec{x}_j)^2. \tag1 $$
Puedo obtener algo diferente. El uso de la Matriz de libro de cocina (ecuación (61)), veo que \begin{eqnarray} \partial_j(\vec{x}_i^T A^{-1} \vec{x}_i) &=& -A^{-1}\vec{x}_i\vec{x}_i^T A^{-1}\cdot\partial_i(A) \tag2\\ &=& -A^{-1}\vec{x}_i\vec{x}_i^T A^{-1} \vec{x}_j\vec{x}_j^T, \end{eqnarray} que es una matriz y no un escalar!
Sé que debo estar haciendo un error en alguna parte. Todavía no estoy muy cómodo con la matriz de cálculo.
Alguien me puede ayudar a averiguar donde me estoy equivocando?