Tenga en cuenta que $A^*A$ es una matriz cuadrada y $A^*A \ge 0$ por lo que existe una base ortonormal $\{u_1, \ldots, u_m\}$ para $\mathbb{R}^m$ tal que $A^*A u_i = \lambda_i u_i$ para algunos $\lambda \ge 0$ .
Tenemos $$\sum_{i=1}^m \|Au_i\|_2^2 = \sum_{i=1}^m \langle Au_i, Au_i\rangle = \sum_{i=1}^m \langle A^*Au_i, u_i\rangle = \sum_{i=1}^m \lambda_i =\operatorname{Tr}(A^*A) = \|A\|_F^2$$
Lo interesante es que la suma $\sum_{i=1}^m \|Au_i\|_2^2$ es realmente independiente de la elección de la base ortonormal $\{u_1, \ldots, u_m\}$ . De hecho, si $\{v_1, \ldots, v_m\}$ es alguna otra base ortonormal para $\mathbb{R}^m$ tenemos \begin{align} \sum_{i=1}^m \|Au_i\|_2^2 &= \sum_{i=1}^m \langle A^*Au_i, u_i\rangle\\ &= \sum_{i=1}^m \left\langle \sum_{j=1}^m\langle u_i,v_j\rangle A^*A v_j , \sum_{k=1}^m\langle u_i,v_k\rangle v_k\right\rangle\\ &= \sum_{j=1}^m \sum_{k=1}^m \left(\sum_{i=1}^m\langle u_i,v_j\rangle \langle v_k,u_i\rangle\right)\langle A^*A v_j,v_k\rangle\\ &= \sum_{j=1}^m \sum_{k=1}^m \langle v_j,v_k\rangle\langle A^*A v_j,v_k\rangle\\ &= \sum_{j=1}^m \langle A^*A v_j,v_j\rangle\\ &= \sum_{j=1}^m \|Av_j\|_2^2 \end{align}
Por lo tanto, podemos extender cualquier conjunto ortonormal $\{v_1, \ldots, v_k\} \subseteq \mathbb{R}^m$ a una base ortonormal $\{v_1, \ldots, v_m\}$ para $\mathbb{R}^m$ para obtener $$\sum_{i=1}^k \|Av_i\|_2^2 \le\sum_{i=1}^m \|Av_i\|_2^2 = \sum_{i=1}^m \|Au_i\|_2^2 = \|A\|_F^2 $$