Supongamos que tengo muestras extraídas de las categorías A, B, C. Dentro de esas categorías, tengo las subcategorías d,e,f que se encuentran en las 3 categorías. Quiero visualizar cuántas muestras tengo de las categorías A, B, C et la composición proporcional de las subcategorías d,e,f dentro de cada categoría.
Una forma de hacerlo es un gráfico de barras (estoy usando ggplot2, no es que importe demasiado) con barras para A, B, C, alturas proporcionales a su número total de muestras. Dentro de cada barra lo divido por color de relleno basado en la composición de d,e,f dentro de la categoría. El problema con esto es que como A, B y C tendrán alturas diferentes, es casi imposible comparar visualmente las proporciones - por ejemplo, la proporción de d en A con la proporción de d en B.
Para ver las proporciones, puedo renormalizar las alturas al 100% en lugar del recuento de la muestra, de forma que las barras de A, B y C tengan ahora la misma altura. Sin embargo, ahora no puedo visualizar los recuentos en A, B y C.
¿Existe una forma elegante de visualizar ambas informaciones simultáneamente?
2 votos
Las parcelas de productos de Hadley Wickham parecen un enfoque fructífero para lo que usted sugiere, véase esta respuesta con un ejemplo y más referencias.
0 votos
Gracias @Andy W ... un gráfico de columna vertebral es en realidad perfecto para esto ya que las subcategorías son las mismas en todas las categorías (también he intentado gráficos de mosaico, pero un gráfico de columna vertebral es mejor para las comparaciones). El uso de la anchura horizontal para el recuento de categorías parece tan obvio en retrospectiva. Ahora bien, si sólo pudiera hacer esto en ggplot2 sin los cálculos de apilamiento horizontal y vertical desordenado (hay una función spineplot en el paquete base, pero se ve bastante feo).