Creo que lo que principalmente necesita ser añadido a su lista coplots, pero vamos a trabajar nuestro camino hasta que. El punto de partida para la visualización de dos variables continuas, siempre debe ser un diagrama de dispersión. Con más de dos variables, que generaliza de forma natural a un diagrama de dispersión de la matriz (aunque si usted tiene un montón de variables, puede que tenga que partir de que en varias matrices, consulte: Cómo extraer información de un diagrama de dispersión de la matriz cuando se tiene gran N, datos discretos, y muchas variables?). Lo que hay que reconocer es que un diagrama de dispersión de la matriz es un conjunto de 2D marginal proyecciones de un mayor espacio tridimensional. Pero los márgenes no pueden ser los más interesantes o informativas. Exactamente lo que los márgenes de usted puede ser que desee mirar a es una pregunta difícil (cf., proyección de búsqueda), pero la forma más simple posible siguiente juego que vamos a examinar es el conjunto que hace que las variables ortogonales, es decir, diagramas de dispersión de las variables que son el resultado de un análisis de componentes principales. Usted menciona el uso de este para la reducción de datos y mirando el diagrama de dispersión de las dos primeras componentes principales. El pensamiento detrás de que es razonable, pero usted no tiene que mirar a los dos primeros, los demás pueden ser vale la pena explorar (cf., Ejemplos de PCA donde PCs con baja varianza son "útiles"), por lo que se puede / debe hacer un diagrama de dispersión de la matriz de esos, también. Otra posibilidad con la salida de un PCA es hacer un diagrama de dispersión biespacial, que se superpone a la forma en que las variables originales están relacionados con los componentes principales (flechas) en la parte superior del diagrama de dispersión. También se podría combinar un diagrama de dispersión de la matriz de componentes principales con los diagramas de dispersión biespacial.
Todas las anteriores son marginales, como ya he mencionado. Un coplot es condicional (la parte superior de mi respuesta aquí contrastes condicional vs marginales). Literalmente, 'coplot' es una combinación de la palabra de 'condicional de la trama". En un coplot, usted está tomando rodajas (o subconjuntos) de los datos en las otras dimensiones y trazado de los datos en los subconjuntos en una serie de diagramas de dispersión. Una vez que usted aprende a leer con ellos, es una buena adición a su serie de opciones para descubrir patrones en los de mayores dimensiones de los datos.
Para ilustrar estas ideas, aquí está un ejemplo con la RandU conjunto de datos (datos pseudoaleatorios generados por un algoritmo que fue popular en la década de 1970):
data(randu)
windows()
pairs(randu)
![enter image description here]()
pca = princomp(randu)
attr(pca$scores, "dimnames")[[1]][1:400] = "o"
windows()
par(mfrow=c(3,3), mar=rep(.5,4), oma=rep(2,4))
for(i in 1:3){
for(j in 1:3){
if(i<j){
plot(y=pca$scores[,i], x=pca$scores[,j], axes=FALSE); box()
} else if(i==j){
plot(density(pca$scores[,i]), axes=FALSE, main=""); box()
text(0, .5, labels=colnames(pca$scores)[i])
} else {
biplot(pca, choices=c(j,i), main="", xaxp=c(-10,10,1), yaxp=c(-10,10,1))
}
}
}
![enter image description here]()
windows()
coplot(y~x|z, randu)
![enter image description here]()