32 votos

Visualizar un millón, edición PCA

¿Es posible visualizar los resultados del análisis de componentes principales de forma que ofrezcan más información que las tablas de resumen? ¿Es posible hacerlo cuando el número de observaciones es grande, digamos ~1e4? ¿Y es posible hacerlo en R [otros entornos son bienvenidos]?

55voto

guillermooo Puntos 2711

El biplot es una herramienta útil para visualizar los resultados del PCA. Permite visualizar las puntuaciones de los componentes principales y las direcciones simultáneamente. Con 10.000 observaciones es probable que se encuentre con un problema de sobretrazado. La mezcla de alfa podría ayudar allí.

Aquí hay un biplot de PC del datos de vino del repositorio ML de la UCI :

PC Biplot of Wine Data from  UCI ML Repository

Los puntos corresponden a las puntuaciones PC1 y PC2 de cada observación. Las flechas representan la correlación de las variables con PC1 y PC2. El círculo blanco indica la extensión máxima teórica de las flechas. Las elipses corresponden al 68% de los datos para cada una de las 3 variedades de vino de los datos.

He hecho el el código para generar este gráfico está disponible aquí .

4voto

Akira Puntos 1061

Un gráfico de Wachter puede ayudarle a visualizar los valores propios de su PCA. Se trata esencialmente de un gráfico Q-Q de los valores propios frente a la distribución Marchenko-Pastur. Tengo un ejemplo aquí: Wachter plot showing a single dominant eigenvalue Hay un valor propio dominante que cae fuera de la distribución de Marchenko-Pastur. La utilidad de este tipo de gráfico depende de su aplicación.

0voto

MGOwen Puntos 122

También puedes utilizar el paquete de psicología.

Contiene un método plot.factor, que trazará los diferentes componentes entre sí al estilo de una matriz de dispersión.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X