4 votos

Cómo resaltar grupos predefinidos en el PCA individuales mapa?

Esto tiene una respuesta simple, pero ha sido eludir mí, sin embargo.

He estado tratando de construir un PCA de la trama desde el principio con la capacidad para trazar grupos predefinidos en diferentes colores. Puedo parcela PCA pero quiero parcela con grupos predefinidos (muestras) con la parte superior de 100 genes que se expresan. Tengo tres grupos. Cualquier organismo puede ayudarme teniendo en cuenta que el usuario es un principiante en R?

En realidad tengo miRNA datos de affymetrix chip. Los datos se clasifican en 3 grupos. He utilizado limma paquete para el análisis. Hice RMA de normalización, eBayes etc. Pero no recibí ninguna miRNA significativamente expresadas en cualquier grupo. Cuando se me planteó preguntas acerca de ella en la red, alguien me sugirió la PCA, análisis, etc. para quitar outliners y seguir adelante con el análisis normal, como yo hice.

Ahora me va a apreciar el cuerpo me puede orientar desde el principio

5voto

DavLink Puntos 101

Déjame continuar con mi comentario con una ilustración para el caso de que usted está interesado en los actuales paquetes de R. Hay varios paquetes en el Multivariante de la Vista de Tareas que va a proporcionar un mejor método para PCA-métodos relacionados (como en comparación con el R base prcomp y princomp), por ejemplo, ade4 o FactorMineR. Personalmente, me gusta FactoMineR debido a su sintaxis simple, y que se revise el sitio web para obtener más información sobre los métodos disponibles.

Uno puede utilizar complementaria categórica y/o variables numéricas cuando la aplicación de un PCA. Estas variables no son utilizados para construir el factor de ejes, pero puede ser mostrado después en el círculo de correlación (para variables numéricas) o el individuo mapa (variables categóricas). Aquí es un juguete ejemplo de uso de la ayuda en línea):

 data(decathlon)
 res.pca <- PCA(decathlon, quanti.sup = 11:12, quali.sup=13)
 plotellipses(res.pca,13)

enter image description here

Si usted tiene múltiples pasivo variables, se puede seleccionar uno para mostrar (con o sin la confianza de los puntos suspensivos) el uso de la keepvar= argumento. Aquí hay otra foto con dos variables ilustrativas.

enter image description here

Tenga cuidado con los argumentos que son un poco no estándar si se utilizan de forma predeterminada representación de funciones en R. La plotellipses() función hace uso de la función de ayudante ellipse::ellipse que puede utilizar (o no) en cualquier parcela ( monpanel.ellipse subfunción en plotellipses() para ver cómo la confianza líneas son calculadas). Que es lo que hice para construir individuo específico de mapa de B&W, los diferentes trazado símbolo, etc.). Por ejemplo, el siguiente fragmento de una gráfica de todos los individuos con dos símbolos diferentes, dependiendo del tipo de evento deportivo (2004 juegos Olímpicos o 2004 Decastar):

labs <- paste(round(res.pca$eig[1:2, 2], 2), "%", sep="")
plot(res.pca$ind$coord[,1:2], pch=as.numeric(decathlon$Competition),
     xlab=paste("Dim. 1 (", labs[1], ")", sep=""), 
     ylab=paste("Dim. 2 (", labs[2], ")", sep=""))
abline(v=0, h=0, lty=2)

Además, me gustaría señalar que @vqv excelente ggbiplot paquete, disponible en GitHub, que es la continuación de uno de su respuesta. (Utiliza R de la base de funciones y ggplot2.)

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X