Parece que a menudo lo que alguien realmente quiere trazar es un intervalo de confianza de algún tipo, pero el uso de SE para este propósito creo que sólo termina comprendiendo algo así como una banda de confianza del 68%. Por lo tanto, trazar el SE para las barras de error en lugar de una banda más amplia que represente el nivel de significación de su análisis sugiere visualmente una significación en sus datos que puede no estar realmente allí.
Considere el siguiente ejemplo concreto:
set.seed(123)
X <- rnorm(100, 0, 1)
Y <- rnorm(100,1.7,5)
df = data.frame(X,Y)
boxplot(df)
se.x = sd(X)/sqrt(length(X))
se.y = sd(Y)/sqrt(length(Y))
X.err.CI = 1.96*se.x
Y.err.CI = 1.96*se.y
plot(1:2, colMeans(df), ylim=c(-1,3), xlim = c(0.5,4.5), col="dark green"
, main="Comparison of SE bars vs 95% CI")
lines(c(1,1), c(mean(X) + X.err.CI, mean(X) - X.err.CI), col="dark green")
lines(c(2,2), c(mean(Y) + Y.err.CI, mean(Y) - Y.err.CI), col="dark green")
text(1:2 + .2, colMeans(df), c("X","Y"))
points(3:4, colMeans(df), col="blue")
lines(c(3,3), c(mean(X) + se.x, mean(X) - se.x), col="blue")
lines(c(4,4), c(mean(Y) + se.y, mean(Y) - se.y), col="blue")
text(3:4 + .2, colMeans(df), c("X","Y"))
abline(v=2.5, lty=2)
legend("topright"
,c("95% CI", "+/- SE")
,lty=c(1,1)
,pch=c(1,1)
,col=c("dark green", "blue")
)
Si sólo basamos nuestro análisis en el SE (la imagen de la derecha), visualmente parece que hay significación entre las medias de X e Y porque no tenemos superposición en nuestras barras de error. Pero si hacemos la prueba a un nivel de significación del 5%, el trazado de las bandas de confianza del 95% muestra que claramente no es así.
Dado que podemos esperar que una prueba al nivel del 32% nunca será apropiada, ¿por qué mostrar siquiera las barras de SE, ya que probablemente se interpretarán como si representaran un intervalo de confianza? ¿La gente utiliza las barras de SE en lugar de los IC más significativos porque es medianamente más fácil de calcular (por ejemplo, utilizando una función incorporada en Excel)? Parece que estamos pagando un coste bastante alto en términos de interpretabilidad de nuestro gráfico a cambio de unos minutos menos de trabajo. ¿Hay algún valor/utilidad en las barras SE que me esté perdiendo?
Para contextualizar, me he visto impulsado a escribir esto después de hojear este artículo . Me frustró la falta de intervalos de confianza en los gráficos proporcionados por los autores, y luego, cuando finalmente los proporcionaron, resultó que sólo eran barras de SE.