13 votos

Una explicación fácil para el paralelo de las coordenadas de la parcela

He leído y visto un montón de coordenadas Paralelas parcelas. Alguien puede responder a las siguientes preguntas:

  1. ¿Cuáles son paralelos coordenadas de las parcelas (PCP) en palabras simples, por lo que un laico puede entender?
  2. Un matemático explicación con algunos intuición si es posible
  3. Cuando se PCP útil y cuándo utilizarlos?
  4. Cuando se PCP no es útil y cuándo se deben evitar?
  5. Posibles ventajas y desventajas de la PCP

6voto

DavLink Puntos 101

A mí me parece que la función principal de la PCP es para resaltar grupos homogéneos de individuos, o a la inversa (en el doble espacio, por analogía con PCA) de los patrones específicos de asociación de las diferentes variables. Se produce un eficaz resumen gráfico de un conjunto de datos multivariante, cuando no son demasiado variables. Las Variables se escala automáticamente a un intervalo fijo (normalmente, 0-1), que es equivalente a trabajar con variables estandarizadas (para evitar la influencia de una variable sobre las demás debido a la ampliación de la revista), pero de muy alta dimensión del conjunto de datos (# de variables > 10), definitivamente tiene que mirar a otras pantallas, como la fluctuación de la parcela o "mapa de calor" como se usa en los estudios de microarrays.

Ayuda a responder a preguntas como:

  • hay un patrón consistente de los puntajes individuales que puede explicarse por la específica de pertenencia a una clase (por ejemplo, diferencia de género)?
  • hay sistemática de la covariación entre las puntuaciones observadas en dos o más variables (por ejemplo, la baja de las puntuaciones observadas en la variable $X_1$ siempre está asociada a un alto puntaje en $X_2$)?

En la siguiente trama del Iris de los datos, se ve claramente que las especies (aquí se muestra en diferentes colores) muestran muy discriminante de los perfiles cuando se considera pétalo de la longitud y la anchura, o que Iris setosa (azul) son más homogéneos con respecto a su longitud del pétalo (es decir, su varianza es menor), por ejemplo.

alt text

Incluso se puede utilizar como base para la clasificación o la reducción de dimensiones técnicas, como el PCA. Más a menudo, cuando se realiza un PCA, además de la reducción de las características del espacio también quiero destacar de grupos de individuos (por ejemplo, hay personas que de forma sistemática la puntuación más alta en alguna combinación de las variables); esto es generalmente por la aplicación de algún tipo de agrupamiento jerárquico en el factor de puntuaciones y destacando la resultante de la pertenencia al clúster en el espacio factorial (véase el FactoClass paquete de R).

También se utiliza en clustergrams (la Visualización de la no-jerárquica y de cluster jerárquico de análisis), que tiene por objeto examinar cómo clúster de asignación evoluciona al aumentar el número de clusters (ver también, Lo que pare-criterios para agglomerative de agrupamiento jerárquico se utilizan en la práctica?).

Las pantallas también son útiles cuando se vincula a la habitual dispersión (que por construcción se limita a 2D-relaciones), esto se llama el cepillado y está disponible en la GGobi de visualización de datos del sistema, o el Mondrian de software.

4voto

Judioo Puntos 625

En lo que respecta a las preguntas 3, 4, y 5 sugiero que echa un vistazo a este trabajo

Los patrones de percepción en paralelo coordenadas: la determinación de los umbrales para la identificación de las relaciones por: Jimmy Johansson, Camilla Forsell, Esteras Lind, Matthew Cooper en La Visualización De La Información, Vol. 7, Nº 2. (2008), pp 152-162.

Para resumir sus hallazgos personas están bien por la identificación de la dirección de la pendiente de la relación entre cada uno de los nodos, pero no son tan buenos en la identificación de la intensidad de la relación o el grado de la pendiente. Dan sugerido que los niveles de ruido en el que la gente todavía puede descifrar la relación en el artículo. Por desgracia, el artículo no trata de la identificación de los subgrupos a través de color, como chl demuestra.

4voto

Adam Puntos 6342

Por favor visite http://www.cs.tau.ac.il/~aiisreal/ y también en el nuevo libro

En paralelo Coordenadas - Este libro es acerca de la visualización, la incorporación sistemática de el fantástico humanos, el reconocimiento de patrones en el proceso de resolución de problemas... www.springer.com/math/cse/book/978-0-387-21507-5.

En Ch. 10 hay un montón de ejemplos reales con multivariante de los datos que muestran cómo paralelo coordenadas (abbr. ||-cs) puede ser utilizado. También es digno de aprender algunas de las matemáticas para visualizar y trabajar con multivariante/multidimensional de las relaciones (superficies) y no sólo los de punto conjuntos. Es divertido de ver y trabajar con los análogos de objetos familiares en muchas dimensiones, es decir banda de Moebius, conjuntos convexos y más.

En la corta ||-cs son multidimensional del sistema de coordenadas donde los ejes son paralelos entre sí, permitiendo un montón de ejes para ser visto. La metodología se ha aplicado para la resolución de Conflictos de los algoritmos de Control de Tráfico Aéreo, de la Visión de Computadora, Control de Procesos y de Apoyo a la Decisión.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X