Dada una matriz de covarianza $\mathbf\Sigma$, el primer componente principal $u_1$ es el vector unitario que maximiza la varianza $u_1'\mathbf\Sigma u_1$. ¿Existen expresiones similares que la primera $k$ de componentes principales optimizar cuando se toman juntos? En otras palabras, ¿por qué hemos de maximizar/minimizar cuando echamos un vistazo a estos componentes principales con avidez?
Un pensamiento es que la primera $k$ principales componentes de definir un subespacio que maximiza la suma de las normas de la proyección de los vectores. Esto es cierto cuando nos maximizar la varianza, mientras que el cálculo del primer componente principal. Sin embargo, no estoy seguro de si esta intuición, o algo más, tiene en general.