Creo que hay una errata " $\Sigma \in \mathbb{R}^{m \times n}$ ". Debe ser " $\Sigma \in \mathbb{R}^{m \times m}$ "(ya que en la definición de $S(p)$ se multiplica por los vectores de la misma dimensión de ambos lados). Utilice las siguientes reglas de derivación de vectores ( $\langle \cdot, \cdot \rangle$ es el producto punto en $\mathbb{R}^n$ ):
-
$\nabla_p \langle p, c \rangle = c$ , donde $c \in \mathbb{R}^n$ es una constante (con respecto a $p$ ) vector.
-
$\nabla_p \langle Ap, p \rangle = (A + A^T)p$ , donde $A \in \mathbb{R}^{n\times n}$ es una constante (con respecto a $p$ ).
-
$\langle x, y \rangle = x^T y$ .
Así que podemos escribir
$S(p) = \langle \Sigma^{-1}(w + Ap), (w + Ap)\rangle = \langle \Sigma^{-1}w, w \rangle + \langle \Sigma^{-1}w, Ap \rangle + \langle \Sigma^{-1}Ap, w \rangle + \langle \Sigma^{-1}Ap, Ap \rangle = \{\Sigma \text{ is symmetric}\} = \langle \Sigma^{-1}w, w \rangle + 2 \langle A^T \Sigma^{-1}w, p\rangle + \langle A^T\Sigma^{-1}Ap, p\rangle.$
Por lo tanto (utilizando las reglas anteriores):
$\nabla_p S(p) = 2A^T\Sigma^{-1}w + (A^T\Sigma^{-1}A + (A^T\Sigma^{-1}A)^T)p = 2A^T\Sigma^{-1}w + 2A^T\Sigma^{-1}Ap = 2A^T\Sigma^{-1}(w + Ap) = (2(Ap + w)^T\Sigma^{-1}A)^T = 0.$
Transponiendo ambos lados obtenemos la igualdad de la solución de tu maestro.