21 votos

Cómo mostrar las barras de error de los experimentos cruzados (emparejados)

El siguiente escenario se ha convertido en el Most-FAQ en el trío de investigador (I), revisor/editor (R, no relacionado con CRAN) y yo (M) como creador de la trama. Podemos suponer que (R) es el típico revisor del gran jefe médico, que sólo sabe que cada parcela debe tener barra de error, de lo contrario es incorrecta. Cuando un revisor estadístico está involucrado, los problemas son mucho menos críticos.

Escenario

En un típico estudio farmacológico cruzado, se comprueba el efecto de dos fármacos A y B sobre el nivel de glucosa. Cada paciente se somete a la prueba dos veces en orden aleatorio y bajo el supuesto de que no hay arrastre. El criterio de valoración primario es la diferencia entre la glucosa (B-A), y suponemos que una prueba t pareada es adecuada.

(I) quiere un gráfico que muestre los niveles absolutos de glucosa en ambos casos. Teme el deseo de (R) de tener barras de error, y pide errores estándar en los gráficos de barras. No empecemos la guerra de los gráficos de barras aquí._)

bar graphs and SE glucose for two treatments

(I): Eso no puede ser cierto. ¿Las barras se superponen y tenemos p=0,03? Eso no es lo que he aprendido en el instituto.

(M): Aquí tenemos un diseño emparejado. Las barras de error solicitadas son totalmente irrelevantes, lo que cuenta es el SE/CI de las diferencias emparejadas, que no se muestran en el gráfico. Si pudiera elegir y no hubiera demasiados datos, preferiría el siguiente gráfico

Joined lines show the pairing, dots the original values

Añadido 1: Este es el gráfico de coordenadas paralelas mencionado en varias respuestas

(M): Las líneas muestran el emparejamiento, y la mayoría de las líneas suben, y esa es la impresión correcta, porque la pendiente es lo que cuenta (vale, esto es categórico, pero no obstante).

(I): Esa imagen es confusa. Nadie la entiende, y no tiene barras de error (R está al acecho).

(M): También podríamos añadir otro gráfico que muestre el intervalo de confianza pertinente de la diferencia. La distancia de la línea cero da una impresión del tamaño del efecto.

(I): Nadie lo hace

(R): Y desperdicia árboles preciosos

(M): (Como buen alemán): Sí, el punto de los árboles se toma. Pero, sin embargo, yo uso esto (y nunca se publica) cuando tenemos múltiples tratamientos y múltiples contrastes.

confidence interval of the difference

Alguna sugerencia ? El R-Code está abajo, si quieres crear un gráfico.

# Graphics for Crossover experiments
library(ggplot2)
library(plyr)
theme_set(theme_bw()+theme(panel.margin=grid::unit(0,"lines")))
n = 20
effect = 5 
set.seed(4711)
glu0 = rnorm(n,120,30)
glu1 = glu0 + rnorm(n,effect,7)
dt = data.frame(patient = rep(paste0("P",10:(9+n))),              
                treatment = rep(c("A","B"), each=n),glucose = c(glu0,glu1))

dt1 = ddply(dt,.(treatment), function(x){
  data.frame(glucose = mean(x$glucose), se = sqrt(var(x$glucose)/nrow(x)) )})

tt = t.test(glucose~treatment,paired=TRUE,data=dt,conf.int=TRUE)
dt2 = data.frame(diff = -tt$estimate,low=-tt$conf.int[2], up=-tt$conf.int[1])
p = paste("p =",signif(tt$p.value,2))

png(height=300,width=300)
ggplot(dt1, aes(x=treatment, y=glucose, fill=treatment))+      
  geom_bar(stat="identity")+  
  geom_errorbar(aes(ymin=glucose-se, ymax=glucose+se),size=1., width=0.3)+
  geom_text(aes(1.5,150),label=p,size=6)

ggplot(dt,aes(x=treatment,y=glucose, group=patient))+ylim(0,190)+
  geom_line()+geom_point(size=4.5)+
  geom_text(aes(1.5,60),label=p,size=6)

ggplot(dt2,aes(x="",y=diff))+
  geom_errorbar(aes(ymin=low,ymax=up),size=1.5,width=0.2)+ 
  geom_text(aes(1,-0.8),label=p,size=6)+
  ylab("95% CI of difference glucose B-A")+  ylim(-10,10)+
  theme(panel.border=element_blank(), panel.grid.major.x=element_blank(),
         panel.grid.major.y=element_line(size=1,colour="grey88"))

dev.off()

18voto

Anthony Cramp Puntos 126

Tiene usted toda la razón al suponer que las barras de error que representan el error estándar de la media son totalmente inapropiadas para los diseños intra-sujetos. Sin embargo, la cuestión de las barras de error superpuestas y la significación es otro tema, al que volveré al final de esta lista de referencias comentada.

Existe una rica literatura de Psicología sobre los intervalos de confianza dentro de los sujetos o las barras de error que hacen exactamente lo que usted quiere. El trabajo de referencia es claramente:

Loftus, G. R., y Masson, M. E. J. (1994). Utilización de los intervalos de confianza en los diseños intra-sujetos . Psychonomic Bulletin & Review , 1(4), 476-490. doi:10.3758/BF03210951

Sin embargo, su problema es que utilizan lo mismo término de error para todos los niveles de un factor intra-sujeto. Esto no parece ser un gran problema para su caso (2 niveles). Pero hay enfoques más modernos para resolver este problema. El más notable:

Franz, V., y Loftus, G. (2012). Errores estándar e intervalos de confianza en diseños intra-sujetos: Generalizando a Loftus y Masson (1994) y evitando los sesgos de las cuentas alternativas . Psychonomic Bulletin & Review 1-10. doi:10.3758/s13423-012-0230-1

Baguley, T. (2011). Calcular y graficar los intervalos de confianza dentro del sujeto para ANOVA. Métodos de investigación del comportamiento . doi:10.3758/s13428-011-0123-7 [ se puede encontrar aquí ]

Se pueden encontrar más referencias en estos dos últimos documentos (que creo que merece la pena leer).


¿Cómo interpretan los investigadores los IC? Mal según el siguiente documento:

Belia, S., Fidler, F., Williams, J., & Cumming, G. (2005). Los investigadores malinterpretan los intervalos de confianza y las barras de error estándar . Métodos psicológicos 10(4), 389-396. doi:10.1037/1082-989X.10.4.389

¿Cómo debemos interpretar los IC superpuestos y no superpuestos?

Cumming, G., y Finch, S. (2005). Inferencia por el ojo: Intervalos de confianza y cómo leer imágenes de datos . Psicólogo americano , 60(2), 170-180. doi:10.1037/0003-066X.60.2.170


Una última reflexión (aunque no es relevante para tu caso): Si tiene un diseño de parcela dividida (es decir, factores dentro y entre sujetos) en una parcela, puede olvidarse de las barras de error. Yo recomendaría (humildemente) mi raw.means.plot en el paquete R plotrix .

11voto

Nick Cox Puntos 22819

La pregunta no parece referirse tanto a las barras de error como a la mejor forma de representar los datos emparejados.

En esencia, las barras de error son, a lo sumo, una forma de resumir la incertidumbre: no dicen, y necesariamente no pueden decir, mucho sobre ninguna estructura fina de los datos.

Los gráficos de coordenadas paralelas -a veces llamados gráficos de perfil, un término que significa cosas diferentes en distintos campos- se han mencionado en la pregunta. Los gráficos de dispersión básicos ya han sido sugeridos por @Ray Koopman.

Un gráfico de dispersión especializado popular aquí y allá es un gráfico de diferencia (aquí $A - B$ , digamos) frente a la media (o la suma) $(A + B)/2$ o $A + B$ . En medicina esto se conoce a menudo como bland-altman-plot (quizás porque fue utilizado anteriormente por Oldham) y en estadística se conoce a menudo como gráfico de diferencia de medias de Tukey.

Otra fuente de este gráfico es Neyman, J., Scott, E. L. y Shane, C. D. 1953. On the spatial distribution of galaxies: a specific model. Revista de Astrofísica 117: 92-133.

A grandes rasgos, estos gráficos se asemejan a la idea de trazar los residuos frente al ajuste, también popularizada por Tukey y su cuñado Anscombe.

La idea clave de estos gráficos es que la línea horizontal de no diferencia $A - B = 0$ es naturalmente equivalente a la línea de igualdad $A = B$ Pero a menudo es más fácil psicológicamente trabajar con una línea de referencia horizontal. Además, si $A$ y $B$ son ampliamente similares, un gráfico de dispersión utiliza gran parte de su espacio para resaltar este hecho, mientras que la estructura de las diferencias debería ser de mayor interés.

Un diseño descuidado es el gráfico de líneas paralelas de McNeil, D.R. 1992. On graphing paired data. Estadístico americano 46: 307-310. Esto también se discute en las dos referencias siguientes.

Las revisiones vinculadas a Stata, con varias referencias, están en

2004, Graphing agreement and disagreement. Revista Stata 4: 329-349.

.pdf accesible en http://www.stata-journal.com/sjpdf.html?articlenum=gr0005

Gráficos pareados, paralelos o de perfil para cambios, correlaciones y otras comparaciones. Revista Stata 9: 621-639.

.pdf accesible en http://www.stata-journal.com/sjpdf.html?articlenum=gr0041

Los que no son usuarios de Stata deberían poder saltarse y tararear el código de Stata mientras resuelven cómo implementar los gráficos en su propio software favorito.

En todos los casos, si la relación de $A$ y $B$ es de interés más que su diferencia, se deben utilizar exactamente las mismas ideas, pero empleando escalas logarítmicas.

5voto

Calvin Puntos 111

Intenta un gráfico de dispersión de los puntos individuales (A,B). La mayoría de ellos debería estar en un solo lado de la diagonal (la línea A = B). Hay dos análogos de barras de error. La convencional, equivalente a un IC para la diferencia de medias, sería una banda de confianza para la diferencia de medias. La banda sería la región entre dos líneas, ambas paralelas a la diagonal. Una prueba t pareada sería significativa si y sólo si ambos bordes de la banda están en el mismo lado de la diagonal.

Un análogo más conservador de la barra de error sería una elipse de confianza para el centroide.

5voto

Drag0n Puntos 21

Resumen preliminar:

Masson/Loftus es muy exhaustivo, y no es una lectura fácil de dar a mis colegas médicos que no aceptarían algo como una "interacción". También tienen algunas sugerencias para las comparaciones múltiples, que muestran que los intervalos de confianza por pares son difíciles de ilustrar cuando no se quiere simplificar mucho.

Masson Loftus

No me gusta este estilo: las barras con barras de error parecen de Excel del último milenio. Sin embargo, también utilizan un estilo un poco más elegante:

Masson Loftus without bars

Cumming/Finch y Belia et al. son lecturas obligadas. La primera es la opción perfecta para regalar a tu amigo que se estremece cuando ve la palabra interacción . Pedí el libro de Cumming después de leer ese artículo. El segundo muestra una prueba que pondré en práctica en Brillante para la próxima reunión de investigadores médicos.

Cumming/Finch

Me gusta este gráfico, aunque hay un segundo eje que nunca he utilizado antes; compruebe la contribución de Henrik y de algunos otros en StackOverflow para un método gráfico de base R para obtenerlo. Yo preferiría poner el segundo eje a la izquierda de la diferencia para dejar absolutamente claro que los valores cambiaron, y tal vez añadir un eje de valor p.

¿Alguien de la fracción lattice/ggplot se anima? Todas las soluciones suministradas son gráficos de base y no son panelables/faceables.

Sin embargo: ten en cuenta que los comentarios y los trabajos son en su mayoría del departamento de psicología (y @cbeleites de química dura). Sería bueno obtener comentarios de los revisores de las revistas médicas.

0voto

Andrew Puntos 629

¿Por qué no trazar la diferencia* de cada paciente? A continuación, podría utilizar un histograma, un gráfico de caja o un gráfico de probabilidad normal y superponer un intervalo de confianza del 95% para la diferencia.

  • En algunos escenarios puede ser la diferencia de los logaritmos. Véase, por ejemplo, Patterson & Jones, "Bioequivalence and Statistics in Clinical Pharmacology", Chapman, 2006.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X