Esta va a ser una respuesta no técnica.
Tienes razón: PCA es esencialmente una rotación de los ejes de coordenadas, elegida de tal manera que cada eje exitoso capte tanta varianza como sea posible.
En algunas disciplinas (como por ejemplo la psicología), a la gente le gusta aplicar la PCA para interpretar los ejes resultantes. Es decir, quieren ser capaces de decir que el eje principal #1 (que es una cierta combinación lineal de variables originales) tiene algún significado particular. Para adivinar este significado mirarían los pesos en la combinación lineal. Sin embargo, estos pesos son a menudo desordenados y no se puede discernir un significado claro.
En estos casos, la gente a veces elige jugar un poco con la solución de PCA de vainilla. Toman un cierto número de ejes principales (que se consideran "significativos" por algún criterio), y además rotarlos, tratando de lograr alguna "estructura simple", es decir, combinaciones lineales que serían más fáciles de interpretar. Hay algoritmos específicos que buscan la estructura más simple posible; uno de ellos se llama varimax. Después de la rotación varimax, los componentes sucesivos ya no capturan tanta varianza como sea posible! Esta característica del PCA se rompe al hacer la rotación varimax adicional (o cualquier otra).
Así que antes de aplicar la rotación varimax, tienes componentes principales "no rotados". Y después, tienes componentes principales "rotados". En otras palabras, esta terminología se refiere al post-procesamiento de los resultados del PCA y no a la propia rotación del PCA.
Todo esto se complica un poco por el hecho de que lo que se rota son las cargas y no los ejes principales como tales. Sin embargo, para los detalles matemáticos le remito a usted (y a cualquier lector interesado) a mi larga respuesta aquí: ¿Es PCA seguido de una rotación (como varimax) todavía PCA?