7 votos

¿Por qué se utiliza a veces el error estándar para las "bandas de error" en los gráficos?

Parece que a menudo lo que alguien realmente quiere trazar es un intervalo de confianza de algún tipo, pero el uso de SE para este propósito creo que sólo termina comprendiendo algo así como una banda de confianza del 68%. Por lo tanto, trazar el SE para las barras de error en lugar de una banda más amplia que represente el nivel de significación de su análisis sugiere visualmente una significación en sus datos que puede no estar realmente allí.

Considere el siguiente ejemplo concreto:

set.seed(123)
X <- rnorm(100, 0, 1)
Y <- rnorm(100,1.7,5)
df = data.frame(X,Y)

boxplot(df)

se.x = sd(X)/sqrt(length(X))
se.y = sd(Y)/sqrt(length(Y))

X.err.CI = 1.96*se.x
Y.err.CI = 1.96*se.y

plot(1:2, colMeans(df), ylim=c(-1,3), xlim = c(0.5,4.5), col="dark green"
     , main="Comparison of SE bars vs 95% CI")
lines(c(1,1), c(mean(X) + X.err.CI, mean(X) - X.err.CI), col="dark green")
lines(c(2,2), c(mean(Y) + Y.err.CI, mean(Y) - Y.err.CI), col="dark green")
text(1:2 + .2, colMeans(df), c("X","Y"))

points(3:4, colMeans(df), col="blue")
lines(c(3,3), c(mean(X) + se.x, mean(X) - se.x), col="blue")
lines(c(4,4), c(mean(Y) + se.y, mean(Y) - se.y), col="blue")
text(3:4 + .2, colMeans(df), c("X","Y"))

abline(v=2.5, lty=2)

legend("topright"
       ,c("95% CI", "+/- SE")
       ,lty=c(1,1)
       ,pch=c(1,1)
       ,col=c("dark green", "blue")
       )

enter image description here

Si sólo basamos nuestro análisis en el SE (la imagen de la derecha), visualmente parece que hay significación entre las medias de X e Y porque no tenemos superposición en nuestras barras de error. Pero si hacemos la prueba a un nivel de significación del 5%, el trazado de las bandas de confianza del 95% muestra que claramente no es así.

Dado que podemos esperar que una prueba al nivel del 32% nunca será apropiada, ¿por qué mostrar siquiera las barras de SE, ya que probablemente se interpretarán como si representaran un intervalo de confianza? ¿La gente utiliza las barras de SE en lugar de los IC más significativos porque es medianamente más fácil de calcular (por ejemplo, utilizando una función incorporada en Excel)? Parece que estamos pagando un coste bastante alto en términos de interpretabilidad de nuestro gráfico a cambio de unos minutos menos de trabajo. ¿Hay algún valor/utilidad en las barras SE que me esté perdiendo?

Para contextualizar, me he visto impulsado a escribir esto después de hojear este artículo . Me frustró la falta de intervalos de confianza en los gráficos proporcionados por los autores, y luego, cuando finalmente los proporcionaron, resultó que sólo eran barras de SE.

7voto

michael kevin Puntos 9

La mayoría de las veces es porque "se ha hecho así en el pasado", pero en algunos ámbitos es precisamente porque los autores no hacen inferencias estadísticas directamente a partir de los errores estándar comunicados (aunque, para el documento de ejemplo podría ser razonable hacerlo).

Por ejemplo, los trabajos de investigación en física suelen mostrar los errores estándar relacionados con los errores estadísticos (estimados) en la recogida de datos. Estos se suelen estimar a partir de la ejecución (en la medida de lo posible) del mismo experimento varias veces utilizando la misma configuración y estimando la varianza. Sin embargo, estos errores estadísticos sólo se utilizan muy raramente en un intervalo de confianza/grado de significación directo de confianza/grado de significación. Esto se debe al hecho de que en la mayoría de los experimentos es probable que los errores sistemáticos de varios tipos son probablemente mayores que los errores estadísticos, y estos tipos de errores no son susceptibles de análisis estadístico. Por lo tanto, representar el intervalo de confianza del 95% basándose sólo en los errores estadísticos podría ser engañoso. Los físicos de partículas experimentales, en particular, se esfuerzan mucho por identificar las incertidumbres estadísticas, las incertidumbres sistemáticas y luego las combinan (en formas aprobadas por la comunidad física) en intervalos de confianza (los preprints sobre el descubrimiento del bosón de Higgs son probablemente ejemplos fáciles de encontrar de esto).

2voto

Nate Eldredge Puntos 146

Ya sea por convención o por otro motivo, es honesto en el sentido de que es fácil para el lector desarrollar su propia idea de significado, es decir, mentalmente el lector puede considerar un múltiplo de, digamos, 2 o 3 veces mayor para obtener su propia idea de significado. En cierto sentido, está dejando que los datos hablar por sí mismo en lugar de hablar por los datos .

Desde esta perspectiva, es lógico que el SE sea la base de la banda. Sin embargo, en mi opinión, el título del gráfico debería indicar claramente que la base de la banda es, de hecho, una SE. Del mismo modo, éstas no deberían identificarse de ningún modo como intervalos de confianza sino simplemente como propiedades del conjunto de datos.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X