7 votos

¿Cómo visualizar tanto los recuentos totales de categorías como las proporciones de subcategorías en un gráfico?

Supongamos que tengo muestras extraídas de las categorías A, B, C. Dentro de esas categorías, tengo las subcategorías d,e,f que se encuentran en las 3 categorías. Quiero visualizar cuántas muestras tengo de las categorías A, B, C et la composición proporcional de las subcategorías d,e,f dentro de cada categoría.

Una forma de hacerlo es un gráfico de barras (estoy usando ggplot2, no es que importe demasiado) con barras para A, B, C, alturas proporcionales a su número total de muestras. Dentro de cada barra lo divido por color de relleno basado en la composición de d,e,f dentro de la categoría. El problema con esto es que como A, B y C tendrán alturas diferentes, es casi imposible comparar visualmente las proporciones - por ejemplo, la proporción de d en A con la proporción de d en B.

Para ver las proporciones, puedo renormalizar las alturas al 100% en lugar del recuento de la muestra, de forma que las barras de A, B y C tengan ahora la misma altura. Sin embargo, ahora no puedo visualizar los recuentos en A, B y C.

¿Existe una forma elegante de visualizar ambas informaciones simultáneamente?

2 votos

Las parcelas de productos de Hadley Wickham parecen un enfoque fructífero para lo que usted sugiere, véase esta respuesta con un ejemplo y más referencias.

0 votos

Gracias @Andy W ... un gráfico de columna vertebral es en realidad perfecto para esto ya que las subcategorías son las mismas en todas las categorías (también he intentado gráficos de mosaico, pero un gráfico de columna vertebral es mejor para las comparaciones). El uso de la anchura horizontal para el recuento de categorías parece tan obvio en retrospectiva. Ahora bien, si sólo pudiera hacer esto en ggplot2 sin los cálculos de apilamiento horizontal y vertical desordenado (hay una función spineplot en el paquete base, pero se ve bastante feo).

3voto

Roy Goode Puntos 191

Este ejemplo de gráficos de barras incrustadas/en capas puede representar una alternativa. Las tres categorías principales están representadas por barras individuales, dentro de las cuales hay barras de subcategorías (creadas en ggplot2).

Enlace al blog (Aprender R)

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X