De hecho, la prueba de $\left\| \mathbf{A}\right\|_2 =\max_{\left\| \mathbf{x}\right\|_2=1} \left\| \mathbf{Ax} \right\|_2$ a $\left\| \mathbf{A}\right\|_2 = \sqrt{\lambda_{\max}(\mathbf{A}^H \mathbf{A})}$ es sencillo. En primer lugar, podemos demostrar simplemente cuando $\mathbf{P}$ es hermético $$ \lambda_{\max} = \max_{\| \mathbf{x} \|_2=1} \mathbf{x}^H \mathbf{Px}. $$ Eso es porque cuando $\mathbf{P}$ es hermética, existe una y sólo una matriz unitaria $\mathbf{U}$ que puede diagonalizar $\mathbf{P}$ como $\mathbf{U}^H \mathbf{PU}=\mathbf{D}$ (así $\mathbf{P}=\mathbf{UDU}^H$ ), donde $\mathbf{D}$ es una matriz diagonal con valores propios de $\mathbf{P}$ en la diagonal, y las columnas de $\mathbf{U}$ son los correspondientes vectores propios. Sea $\mathbf{y}=\mathbf{U}^H \mathbf{x}$ y sustituirlo por $\mathbf{x} = \mathbf{Uy}$ al problema de optimización, obtenemos
$$ \max_{\| \mathbf{x} \|_2=1} \mathbf{x}^H \mathbf{Px} = \max_{\| \mathbf{y} \|_2=1} \mathbf{y}^H \mathbf{Dy} = \max_{\| \mathbf{y} \|_2=1} \sum_{i=1}^n \lambda_i |y_i|^2 \le \lambda_{\max} \max_{\| \mathbf{y} \|_2=1} \sum_{i=1}^n |y_i|^2 = \lambda_{\max} $$
Así, con sólo elegir $\mathbf{x}$ como el vector propio correspondiente al valor propio $\lambda_{\max}$ , $\max_{\| \mathbf{x} \|_2=1} \mathbf{x}^H \mathbf{Px} = \lambda_{\max}$ . Esto demuestra $\left\| \mathbf{A}\right\|_2 = \sqrt{\lambda_{\max}(\mathbf{A}^H \mathbf{A})}$ .
Y entonces, porque el $n\times n$ matriz $\mathbf{A}^H \mathbf{A}$ es semidefinido positivo, todos sus valores propios no son menores que cero. Supongamos que $\text{rank}~\mathbf{A}^H \mathbf{A}=r$ podemos poner los valores propios en un orden decreciente:
$$ \lambda_1 \geq \lambda_2 \geq \lambda_r > \lambda_{r+1} = \cdots = \lambda_n = 0. $$
Porque para todos $\mathbf{X}\in \mathbb{C}^{n\times n}$ , $$ \text{trace}~\mathbf{X} = \sum\limits_{i=1}^{n} \lambda_i, $$ donde $\lambda_i$ , $i=1,2,\ldots,n$ son valores propios de $\mathbf{X}$ ; y además, es fácil de verificar $$ \left\| \mathbf{A}\right\|_F = \sqrt{\text{trace}~ \mathbf{A}^H \mathbf{A}}. $$
Así, a través de $$ \sqrt{\lambda_1} \leq \sqrt{\sum_{i=1}^{n} \lambda_i} \leq \sqrt{r \cdot \lambda_1} $$ tenemos $$ \left\| \mathbf{A}\right\|_2 \leq \left\| \mathbf{A}\right\|_F \leq \sqrt{r} \left\| \mathbf{A}\right\|_2 $$