35 votos

Visualización de las intersecciones de muchos conjuntos

¿Existe algún modelo de visualización que sirva para mostrar el solapamiento de la intersección de muchos conjuntos?

Estoy pensando en algo como los diagramas de Venn, pero que de alguna manera podría prestarse mejor a un mayor número de conjuntos, como 10 o más. Wikipedia muestra algunos diagramas de Venn de conjuntos más altos, pero incluso los diagramas de 4 conjuntos son mucho para asimilar.

Mi suposición en cuanto al resultado final de los datos sería que muchos de los conjuntos no se solaparán, por lo que es posible que los diagramas de Venn estén bien, pero me gustaría encontrar una herramienta informática que sea capaz de generarlos. Me parece que Google charts no permite tantos conjuntos.

20voto

Jon Galloway Puntos 28243

Cuando se tiene un gran número de conjuntos, yo probaría con algo que sea más lineal y que muestre los enlaces directamente (como un gráfico de red). Flare y Protovis tienen utilidades para manejar estas visualizaciones.

Ver esta pregunta para ver algunos ejemplos así:

alt text

13voto

DavLink Puntos 101

Esto no competirá con la respuesta de @Shane porque las visualizaciones circulares son realmente adecuadas para mostrar relaciones complejas con conjuntos de datos de alta dimensión.

Para los diagramas de Venn, he estado utilizando el venneuler paquete R. Tiene una interfaz sencilla pero intuitiva y produce ingeniosos diagramas con transparencia, en comparación con el básico venn() función descrito en el Revista de Software Estadístico . Sin embargo, no maneja más de 3 categorías. Otro proyecto es eVenn y se ocupa de $K=4$ conjuntos.

Más recientemente, me encontré con un nuevo paquete que se ocupa de los conjuntos de relaciones de orden superior, y probablemente permite reproducir algunos de los diagramas de Venn mostrados en Wikipedia o en esta página web, ¿Qué es un diagrama de Venn? pero también se limita a $K=4$ conjuntos. Se llama VennDiagram, pero vea el documento de referencia: VennDiagram: un paquete para la generación de diagramas de Venn y Euler altamente personalizables en R (Chen y Boutros, BMC Bioinformática 2011, 12:35).

Para más referencias, puede interesarle

Kestler et al., Venn generalizado diagramas de Venn: un nuevo método de visualización relaciones complejas de conjuntos genéticos , Bioinformática, 21(8), 1592-1595 (2004).

Sin embargo, los diagramas de Venn tienen sus limitaciones. A este respecto, me gusta el enfoque adoptado por Robert Kosara en Avistamientos: Un desafío vulnerable o con Juegos paralelos (pero véase también esta discusión en el weblog de Andrew Gelman).

9voto

Yomama Puntos 6

Hemos desarrollado un enfoque basado en matrices para las intersecciones de conjuntos llamado UpSet, que puedes consultar en http://vcg.github.io/upset/ . He aquí un ejemplo:

UpSet Screenshot

La matriz de la izquierda identifica la intersección que representa una fila, la última fila aquí, por ejemplo, es la intersección de los géneros cinematográficos "Acción, Aventura y Niños". Las barras de la derecha muestran el tamaño de la intersección, 4 en este ejemplo.

También se pueden trazar atributos de las intersecciones u otras selecciones, etc. Consulta el sitio web para obtener más detalles.

Ahora también hay una versión estática para R que puedes encontrar en la página web mencionada anteriormente, o entrando aquí: https://github.com/hms-dbmi/UpSetR/

Se puede acceder a un informe sobre el estado de la técnica de visualización de decorados en http://www.cvast.tuwien.ac.at/SetViz - Sin embargo, la mayoría de ellas son académicas y no vienen con código disponible.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X