15 votos

¿Qué son los componentes principales "girados" y "no girados", dado que el PCA siempre gira los ejes de coordenadas?

Por lo que yo entiendo, los componentes principales se obtienen rotando los ejes de coordenadas para alinearlos con las direcciones de máxima variación.

Sin embargo, sigo leyendo sobre "componentes principales no rotados" y mi software de estadística (SAS) me da componentes principales rotados varimax así como los no rotados. Aquí estoy confundido: cuando calculamos los componentes principales, los ejes ya están rotados; entonces, ¿por qué se necesita otra rotación? ¿Y qué significa "componente principal no girado"?

19voto

zowens Puntos 1417

Esta va a ser una respuesta no técnica.

Tienes razón: PCA es esencialmente una rotación de los ejes de coordenadas, elegida de tal manera que cada eje exitoso capte tanta varianza como sea posible.

En algunas disciplinas (como por ejemplo la psicología), a la gente le gusta aplicar la PCA para interpretar los ejes resultantes. Es decir, quieren ser capaces de decir que el eje principal #1 (que es una cierta combinación lineal de variables originales) tiene algún significado particular. Para adivinar este significado mirarían los pesos en la combinación lineal. Sin embargo, estos pesos son a menudo desordenados y no se puede discernir un significado claro.

En estos casos, la gente a veces elige jugar un poco con la solución de PCA de vainilla. Toman un cierto número de ejes principales (que se consideran "significativos" por algún criterio), y además rotarlos, tratando de lograr alguna "estructura simple", es decir, combinaciones lineales que serían más fáciles de interpretar. Hay algoritmos específicos que buscan la estructura más simple posible; uno de ellos se llama varimax. Después de la rotación varimax, los componentes sucesivos ya no capturan tanta varianza como sea posible! Esta característica del PCA se rompe al hacer la rotación varimax adicional (o cualquier otra).

Así que antes de aplicar la rotación varimax, tienes componentes principales "no rotados". Y después, tienes componentes principales "rotados". En otras palabras, esta terminología se refiere al post-procesamiento de los resultados del PCA y no a la propia rotación del PCA.


Todo esto se complica un poco por el hecho de que lo que se rota son las cargas y no los ejes principales como tales. Sin embargo, para los detalles matemáticos le remito a usted (y a cualquier lector interesado) a mi larga respuesta aquí: ¿Es PCA seguido de una rotación (como varimax) todavía PCA?

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X