La prueba es esencialmente la misma que en el caso en que $X$ y $Y$ son semidefinidos positivos .
Dejemos que $d_1\le\ldots\le d_n$ y $s_1\le\ldots\le s_n$ sean los valores propios de $X$ y $Y$ respectivamente y dejemos que $D=\operatorname{diag}(d_1,\ldots,d_n),\ S=\operatorname{diag}(s_1,\ldots,s_n)$ . Entonces $\operatorname{trace}(XY)=\operatorname{trace}(DQ^TSQ)$ para alguna matriz ortogonal real $Q$ . Obsérvese que el producto de Hadamard $Q\circ Q=(q_{ij}^2)$ es un matriz doblemente estocástica . Por lo tanto, \begin{align} \max_{QQ^T=I} \operatorname{trace}(DQ^TSQ) &=\max_{QQ^T=I} \sum_{i,j}s_id_jq_{ij}^2\\ &\le\max_M \sum_{i,j}s_id_jm_{ij};\ M=(m_{ij}) \textrm{ is doubly stochastic}.\tag{1} \end{align} Como $\sum_{i,j}s_id_jm_{ij}$ es una función lineal en $M$ y el conjunto de todas las matrices doblemente estocásticas es compacto y convexo, $\max\limits_M \sum_{i,j}s_id_jm_{ij}$ se produce en un punto extremo de este conjunto convexo. Por el teorema de Birkhoff, los puntos extremos de las matrices doblemente estocásticas son exactamente esas matrices de permutación. Como las matrices de permutación son ortogonales reales, se deduce que la igualdad se mantiene en $(1)$ y $\max\limits_{QQ^T=I} \operatorname{trace}(DQ^TSQ)=\max\limits_\sigma\sum_i d_is_{\sigma(i)}$ , donde $\sigma$ recorre todas las permutaciones de los índices $1,2,\ldots,n$ . Sin embargo, por inducción matemática sobre $n$ se puede demostrar que $\sum_i d_is_{\sigma(i)}\le\sum_i d_is_i$ (nótese que el caso base aquí es $n=2$ no $n=1$ ). Por lo tanto, la afirmación se deduce.