¿Qué son la mayoría de los métodos aceptados para visualizar los resultados de un independiente two sample t-test? Es un numérico de la tabla se utiliza más a menudo o algún tipo de trama? El objetivo es que para un observador casual a mirar a la figura y ver de inmediato que son, probablemente, a partir de dos poblaciones diferentes.
Respuestas
¿Demasiados anuncios?Vale la pena ser claro sobre el propósito de su parcela. En general, existen dos tipos de metas: usted puede hacer parcelas para evaluar los supuestos que están haciendo y guía el análisis de los datos, o usted puede hacer parcelas para comunicar un resultado a los demás. Estos no son los mismos; por ejemplo, muchos de los espectadores / lectores de su parcela / análisis puede ser estadísticamente sencillos, y pueden no estar familiarizados con la idea de, por ejemplo, la igualdad de la varianza y su papel en un t-test. Usted quiere que su trama a transmitir la información importante acerca de sus datos, incluso para los consumidores como ellos. Están implícitamente la confianza de que se han hecho las cosas correctamente. Por tu pregunta instalación, deduzco que usted es después de que el último tipo.
En realidad, el más común y aceptado para la trama de la comunicación de los resultados de una prueba de t para otros (aparte de si es realmente la más adecuada) es un gráfico de barras de los medios con el estándar de las barras de error. Esto coincide con la prueba de t muy bien en que un t-test compara dos medios, el uso de sus errores estándar. Cuando se tienen dos grupos independientes, esto dará como resultado una imagen que es intuitiva, incluso para los que estadísticamente poco sofisticados y de datos (mediante) la gente puede "ver inmediatamente que son, probablemente, a partir de dos poblaciones diferentes". Aquí es un ejemplo simple del uso de @Tim datos:
nonsmokers <- c(18,22,21,17,20,17,23,20,22,21)
smokers <- c(16,20,14,21,20,18,13,15,17,21)
m = c(mean(nonsmokers), mean(smokers))
names(m) = c("nonsmokers", "smokers")
se = c(sd(nonsmokers)/sqrt(length(nonsmokers)), sd(smokers)/sqrt(length(smokers)))
windows()
bp = barplot(m, ylim=c(16, 21), xpd=FALSE)
box()
arrows(x0=bp, y0=m-se, y1=m+se, code=3, angle=90)
Dicho esto, la visualización de los datos que los especialistas generalmente desdén estas parcelas. Ellos son a menudo ridiculizado como "dinamita parcelas" (cf., Por qué dinamita parcelas son malos). En particular, si usted tiene sólo un par de datos, a menudo se recomienda que usted simplemente mostrar los datos en sí. Si los puntos se superponen, puede fluctuación de ellos (agregar una pequeña cantidad de ruido aleatorio) de manera que no se superpongan. Ya que el t-test es fundamentalmente sobre los medios y los errores estándar, lo mejor es la superposición de los medios y los errores estándar en esa parcela. Aquí está una versión diferente:
set.seed(4643)
plot(jitter(rep(c(0,1), each=10)), c(nonsmokers, smokers), axes=FALSE, xlim=c(-.5, 1.5),
xlab="", ylab="")
box()
axis(side=1, at=0:1, labels=c("nonsmokers", "smokers"))
axis(side=2, at=seq(14,22,2))
points(c(0,1), m, pch=15, col="red")
arrows(x0=c(0,1), y0=m-se, y1=m+se, code=3, angle=90, length=.15)
Si usted tiene un montón de datos, boxplots puede ser una mejor opción para obtener una visión general rápida de las distribuciones, y se puede superponer los medios y SEs.
data(randu)
x1 = qnorm(randu[,1])
x2 = qnorm(randu[,2])
m = c(mean(x1), mean(x2))
se = c(sd(x1)/sqrt(length(x1)), sd(x2)/sqrt(length(x2)))
boxplot(x1, x2)
points(c(1,2), m, pch=15, col="red")
arrows(x0=1:2, y0=m-(1.96*se), y1=m+(1.96*se), code=3, angle=90, length=.1)
# note that I plotted 95% CIs so that they will be easier to see
Trama Simple de los datos, y boxplots, son lo suficientemente simples que la mayoría de la gente será capaz de entender, incluso si no son muy estadísticamente inteligente. Tenga en cuenta, sin embargo, que ninguno de estos hacen que sea fácil para evaluar la validez de haber utilizado una prueba de t para comparar los grupos. Los objetivos son mejor atendidos por los diferentes tipos de parcelas.
El más comúnmente utilizado para visualizar $t$-prueba-como la comparación es el uso de boxplots. A continuación presento ejemplo utilizando el conjunto de datos que describe la relación entre fumar marihuana y un déficit en el rendimiento en una tarea de medición de la memoria de corto plazo" de este sitio.
> nonsmokers <- c(18,22,21,17,20,17,23,20,22,21)
> smokers <- c(16,20,14,21,20,18,13,15,17,21)
>
> t.test(nonsmokers, smokers)
Welch Two Sample t-test
data: nonsmokers and smokers
t = 2.2573, df = 16.376, p-value = 0.03798
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
0.1628205 5.0371795
sample estimates:
mean of x mean of y
20.1 17.5
En realidad, boxplots se utilizan comúnmente para "informales" de la prueba de hipótesis, por ejemplo, como se describe por Yoav Benjamini en 1988 papel de la Apertura de la Caja de un Boxplot:
El regular boxplot es complementado por un aproximado de confianza el intervalo de la mediana de los lotes, se muestra como un par de cuñas tomado fuera de los lados de la caja. Estos intervalos de confianza son construido de tal manera que cuando dos muescas de diferentes boxplots no se superpongan sus medianas son significativamente diferentes. (...) Puesto que la fórmula para el intervalo de confianza es un número constante de veces la rango intercuartil dividido por la raíz cuadrada del tamaño del lote, la esto último puede ser percibido a partir de la longitud de las cuñas en relación a la la longitud de la caja.
Vea también: T-test utilizando sólo los datos de resumen en un cuadro de parcela
Este diagrama no muestra las cantidades involucradas directamente en $t$-prueba, como @NickCox notado. Si desea directa comparación de medias con intervalos de confianza puede utilizar el gráfico de barras , con marcada intervalos de confianza. El uso de los medios y los intervalos de confianza también permite para llevar a cabo la prueba de hipótesis (ver aquí o aquí).
Como se puede ver en otros posts y comentarios en este hilo, tanto boxplots y dinamita parcelas son bastante controvertida elección, así que permítanme darles una alternativa más, que no se ha mencionado todavía. En primer lugar, recordemos que el $t$-prueba de regresión y están relacionados. Usted puede trazar $t$-prueba-como la comparación de dos puntos con errorbars (intervalos de confianza) que están conectados con la línea. La pendiente de la línea es proporcional a la pendiente de regresión si se utiliza la regresión lineal en lugar de $t$-prueba en esta situación. Principal ventaja de este tipo de trama es la que permite que usted fácilmente juez de la magnitud de la diferencia de medios, mirando a la pendiente de la línea. Es la desventaja puede ser que esto puede sugerir que hay algo de "continuidad" entre los medios (es decir, que se había muestras pareadas).
Boxplots parecen ser más comúnmente utilizado, ya que proporcionan más información acerca de la distribución de las variables visualizadas (en comparación a la media, con un intervalo de confianza). También se complementan en lugar de duplicar la información de $t$-prueba y uso de este tipo de argumento es alentado por la mayoría de guías de estilo, por ejemplo, mediante la Publicación del Manual de la American Psychological Association:
La primera consideración es el valor de la información de la figura en el texto de la ponencia en la que va a aparecer. Si la figura no agregar de forma sustancial a la comprensión del papel o duplicados de otros elementos de la comunicación, ésta no debe ser incluido.
Esto es sobre todo una variación en las respuestas útiles por @Tim y @gung, pero los gráficos no se puede instalar en un comentario.
Pequeño pero posiblemente útil puntos:
Una franja de terreno o diagrama de puntos, como se ilustra por @gung necesidades de modificación si hay lazos, como las hay en los datos de ejemplo. Los puntos pueden ser apilados o jitter, o como en el siguiente ejemplo se puede utilizar un híbrido cuantil-diagrama de caja según lo sugerido por Emanuel Parzen (más accesible de referencia es, probablemente, 1979. Estadística no paramétrica de modelado de datos. Diario, La Asociación Americana De Estadística 74: 105-121). Este tiene otros méritos demasiado, al subrayar que si la mitad de los datos dentro de la caja, y luego la mitad están fuera demasiado, y en prácticamente todos los detalles de la distribución. Donde hay sólo dos grupos, ya que hay en este contexto, más de un tipo convencional de la caja de parcela mínima, de hecho esquelético, de la pantalla. Algunos podrían tomar esto como una virtud, pero hay margen para mostrar más detalle. El conversar con el argumento de que un diagrama de caja marcar puntos concretos, en particular de las que más de 1.5 IQR de los más cercanos cuartil, es una clara advertencia para el usuario: cuidado con un t-test, como pueden ser los puntos en las colas que usted debe preocuparse.
Usted, naturalmente, puede agregar una indicación de los medios para un diagrama de caja, que es bastante a menudo se hace. La adición de diferentes marcador o símbolo de punto es común. Aquí elegimos las líneas de referencia.
Cuantil-diagramas de caja para fumadores y no fumadores. Los cuadros muestran las medianas y cuartiles. Las líneas horizontales en azul muestran los medios.
Nota. El gráfico fue creado en Stata. Aquí está el código para los interesados. stripplot
debe estar instalado previamente con ssc inst stripplot
.
clear
mat nonsmokers = (18,22,21,17,20,17,23,20,22,21)
mat smokers = (16,20,14,21,20,18,13,15,17,21)
local n = max(colsof(nonsmokers), colsof(smokers))
set obs `n'
gen smokers = smokers[1, _n]
gen nonsmokers = nonsmokers[1, _n]
stripplot smokers nonsmokers, vertical cumul centre xla(, noticks) ///
xsc(ra(0.6 2.4)) refline(lcolor(blue)) height(0.5) box ///
ytitle(digit span score) yla(, ang(h)) mcolor(red) msize(medlarge)
EDIT. Esta otra idea en respuesta a la respuesta de @Frank Harrell superpone dos de probabilidad normal de las parcelas (en realidad, el cuantil-cuantil parcelas). Las líneas horizontales muestran los medios. Algunos quieren añadir líneas para cada grupo, lo que indica un ajuste perfecto, por ejemplo, a través de ($0$, su media) y de ($1$, su media de $+$ su SD) o robusto resistente a las alternativas.
Además del gol de la presentación de los resultados debe haber alguna consideración acerca de que los gráficos de comprobar la hipótesis de las dos muestras de la igualdad de la varianza $t$-prueba para que tenga un rendimiento excelente. Que sería normal funciones inversas de las dos empírica funciones de distribución acumulativa. Para satisfacer la prueba de la hipótesis de que estos dos curvas deben ser rectas paralelas.