7 votos

Hay ejemplos de más informativo de la PCA de las parcelas?

A menudo estoy decepcionado con la PCA de parcelas en la literatura científica. Normalmente PCA parcelas no proporciona un desglose de las variables y sus ponderaciones, algo como PCA1 (70% de varianza explicada), PCA2 (10% de varianza explicada). Cómo podría uno decir que las variables están fuertemente cargados en un componente?

Hay PCA visualizaciones que puede proporcionar una visión más completa de los datos?

9voto

nakke Puntos 21

En mi humilde opinión, depende de lo que usted desea fuera de la PCA, pero que hay dos tramas sencillas que son bastante comunes y pueden ser útiles:

  • Para saber qué variables tienen altas cargas en el que la componente principal, un simple barplot de cargas (como pequeñas múltiplos) de la pantalla esta bastante claramente.

  • Para buscar patrones entre las muestras de un diagrama de dispersión de las puntuaciones a veces puede ayudar (por ejemplo, en la genética cuando has genotipo de un grupo de individuos, un diagrama de dispersión de la PC1 y la PC2 se utiliza generalmente para buscar los patrones de población).

Si usted sabe o variable de grupos muestrales a priori, el color de los puntos y las barras.

Saludos,

m.

ps. Espero que no sea mala forma de incluir enlaces, pero he escrito un pequeño post acerca de estas parcelas y hacer de ellos en mi software favorito. http://martinsbioblogg.wordpress.com/2013/06/26/using-r-two-plots-of-principal-component-analysis/

4voto

Gmaster Puntos 21

Aquí hay un par de pistas.

  1. Dependiendo de lo que las variables son, las cargas pueden ser muy informativo. Por ejemplo, en los Pca derivados de los datos de expresión génica, que puede utilizar las cargas en combinación con la Ontología de Genes a prueba para el enriquecimiento de las condiciones particulares en las variables con gran absoluta de cargas.

  2. Los diagramas de dispersión biespacial son muy útiles si usted tiene sólo un par de variables, como se puede visualizar perfectamente cuáles son las variables importantes para el componente. Sin embargo, no son muy prácticos si hay demasiadas variables (mi paquete, pca3d, permite seleccionar N "top" de las variables de cada componente a ser muestra de la trama; es la llamada "pca3d", pero también tiene un "pca2d" la función de regular gráficos 2D).

  3. Si usted tiene variables categóricas que el grupo de las muestras en los diferentes grupos, entonces simplemente la coloración de los puntos sobre una parcela estándar puede ser muy informativo (este es el propósito principal de pca3d).

3voto

Jared Farrish Puntos 120

Me parece de dispersión biespacial muy útil. Un diagrama de dispersión biespacial representa tanto a las variables y las observaciones en un espacio definido por dos (o tres) de los componentes. La longitud y la dirección del vector que representa cada variable decirle cuánto le cargas en estos dos componentes, abordar directamente la cuestión al final del primer párrafo.

Usted puede encontrar más información en la Wikipedia y muchos ejemplos/código a través de google.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X