En mi área de investigación, una forma popular de la visualización de datos es el uso de una combinación de un gráfico de barras con los "tiradores". Por ejemplo,
Los "tiradores" de alternar entre los errores estándar y desviaciones estándar según el autor. Normalmente, el tamaño de la muestra para cada "barra" son bastante pequeñas - alrededor de las seis.
Estas parcelas parecen ser particularmente popular en ciencias biológicas - ver los primeros papeles de BMC Biology, vol 3 para ejemplos.
Entonces, ¿cómo se presentan estos datos?
Por qué no me gusta de estas parcelas
Personalmente no me gustan estas parcelas.
- Cuando el tamaño de la muestra es pequeño, ¿por qué no acaba de mostrar los puntos de datos individuales.
- Es la sd o en la se que se muestra? Nadie está de acuerdo que el uso de.
- ¿Por qué utilizar barras. Los datos no (por lo general) es de 0, pero un primer paso en el gráfico sugiere que sí.
- Los gráficos no dan una idea acerca de rango o tamaño de la muestra de los datos.
R script
Este es el R código que he usado para generar la trama. De esa manera usted puede (si quiere) utilizar los mismos datos.
#Generate the data
set.seed(1)
names = c("A1", "A2", "A3", "B1", "B2", "B3", "C1", "C2", "C3")
prevs = c(38, 37, 31, 31, 29, 26, 40, 32, 39)
n=6; se = numeric(length(prevs))
for(i in 1:length(prevs))
se[i] = sd(rnorm(n, prevs, 15))/n
#Basic plot
par(fin=c(6,6), pin=c(6,6), mai=c(0.8,1.0,0.0,0.125), cex.axis=0.8)
barplot(prevs,space=c(0,0,0,3,0,0, 3,0,0), names.arg=NULL, horiz=FALSE,
axes=FALSE, ylab="Percent", col=c(2,3,4), width=5, ylim=range(0,50))
#Add in the CIs
xx = c(2.5, 7.5, 12.5, 32.5, 37.5, 42.5, 62.5, 67.5, 72.5)
for (i in 1:length(prevs)) {
lines(rep(xx[i], 2), c(prevs[i], prevs[i]+se[i]))
lines(c(xx[i]+1/2, xx[i]-1/2), rep(prevs[i]+se[i], 2))
}
#Add the axis
axis(2, tick=TRUE, xaxp=c(0, 50, 5))
axis(1, at=xx+0.1, labels=names, font=1,
tck=0, tcl=0, las=1, padj=0, col=0, cex=0.1)