Loading [MathJax]/jax/element/mml/optable/BasicLatin.js

7 votos

Alternativas a las tres dimensiones diagrama de dispersión

Para una presentación que tengo que visualizar datos tridimensionales. Que debo visualizar en "el estilo de un diagrama de dispersión".

El primero de mayo ideas fueron

  • Un diagrama de dispersión tridimensional
  • Un diagrama de dispersión de la matriz
  • La reducción de dimensionalidad (PCA) y después de dos dimensiones, diagrama de dispersión

¿Cuáles son las alternativas a estos conceptos? Si es posible incluir Código R en su respuesta.

Edit: tengo 40 objetos de 3 dimensiones. Cada observación puede tomar un valor entero de 1 a 6.

3voto

Sean Hanley Puntos 2428

Creo que lo que principalmente necesita ser añadido a su lista coplots, pero vamos a trabajar nuestro camino hasta que. El punto de partida para la visualización de dos variables continuas, siempre debe ser un diagrama de dispersión. Con más de dos variables, que generaliza de forma natural a un diagrama de dispersión de la matriz (aunque si usted tiene un montón de variables, puede que tenga que partir de que en varias matrices, consulte: Cómo extraer información de un diagrama de dispersión de la matriz cuando se tiene gran N, datos discretos, y muchas variables?). Lo que hay que reconocer es que un diagrama de dispersión de la matriz es un conjunto de 2D marginal proyecciones de un mayor espacio tridimensional. Pero los márgenes no pueden ser los más interesantes o informativas. Exactamente lo que los márgenes de usted puede ser que desee mirar a es una pregunta difícil (cf., proyección de búsqueda), pero la forma más simple posible siguiente juego que vamos a examinar es el conjunto que hace que las variables ortogonales, es decir, diagramas de dispersión de las variables que son el resultado de un análisis de componentes principales. Usted menciona el uso de este para la reducción de datos y mirando el diagrama de dispersión de las dos primeras componentes principales. El pensamiento detrás de que es razonable, pero usted no tiene que mirar a los dos primeros, los demás pueden ser vale la pena explorar (cf., Ejemplos de PCA donde PCs con baja varianza son "útiles"), por lo que se puede / debe hacer un diagrama de dispersión de la matriz de esos, también. Otra posibilidad con la salida de un PCA es hacer un diagrama de dispersión biespacial, que se superpone a la forma en que las variables originales están relacionados con los componentes principales (flechas) en la parte superior del diagrama de dispersión. También se podría combinar un diagrama de dispersión de la matriz de componentes principales con los diagramas de dispersión biespacial.

Todas las anteriores son marginales, como ya he mencionado. Un coplot es condicional (la parte superior de mi respuesta aquí contrastes condicional vs marginales). Literalmente, 'coplot' es una combinación de la palabra de 'condicional de la trama". En un coplot, usted está tomando rodajas (o subconjuntos) de los datos en las otras dimensiones y trazado de los datos en los subconjuntos en una serie de diagramas de dispersión. Una vez que usted aprende a leer con ellos, es una buena adición a su serie de opciones para descubrir patrones en los de mayores dimensiones de los datos.

Para ilustrar estas ideas, aquí está un ejemplo con la RandU conjunto de datos (datos pseudoaleatorios generados por un algoritmo que fue popular en la década de 1970):

data(randu)
windows()
  pairs(randu)

enter image description here

pca = princomp(randu)
attr(pca$scores, "dimnames")[[1]][1:400] = "o"
windows()
  par(mfrow=c(3,3), mar=rep(.5,4), oma=rep(2,4))
  for(i in 1:3){
    for(j in 1:3){
      if(i<j){
        plot(y=pca$scores[,i], x=pca$scores[,j], axes=FALSE); box()
      } else if(i==j){
        plot(density(pca$scores[,i]), axes=FALSE, main=""); box()
        text(0, .5, labels=colnames(pca$scores)[i])
      } else {
        biplot(pca, choices=c(j,i), main="", xaxp=c(-10,10,1), yaxp=c(-10,10,1))
      }
    }
  }

enter image description here

windows()
  coplot(y~x|z, randu)

enter image description here

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X