14 votos

¿Es apropiado representar la media en un histograma?

¿Está "bien" agregar una línea vertical a un histograma para visualizar el valor medio?

¿Parece bien a mí, pero nunca he visto esto en los libros de texto y los gustos, así que me pregunto si hay algún tipo de Convenio no hacerlo?

El gráfico es para un trabajo, sólo quiero para asegurarse de que no accidentalmente romper alguna regla super importante estadísticas tácito. :)

30voto

AdamSane Puntos 1825

Por supuesto, ¿por qué no?

histogram with mean

He aquí un ejemplo (uno de las decenas he encontrado con una simple búsqueda en google):

hist with mean and median

(Fuente de la imagen es la medición de la usabilidad del blog, aquí.)

He visto significa, significa más o menos una desviación estándar, diferentes cuantiles (como la mediana, cuartiles, percentiles 10 y 90) todos los que aparecen en varias formas.

En lugar de dibujar una línea a la derecha a través de la trama, puede marcar la información a lo largo de la parte inferior de la misma como:

histogram with marginal boxplot

Hay un ejemplo (uno de los tantos que se encuentran) con un boxplot a través de la parte superior en lugar de en la parte inferior, aquí.

A veces la gente se marca en los datos:

histogram rugplot with jitter
(He jitter las ubicaciones de los datos ligeramente debido a que los valores fueron redondeadas a números enteros y no se puede ver la densidad relativa).

Hay un ejemplo de este tipo, realizado en Stata, en esta página (ver la tercera aquí)

Los histogramas son mejores con un poco más de información que puede ser engañosa en sus propios

Sólo debes tener cuidado para explicar lo que su parcela consta de! (Usted querrá un mejor título y la etiqueta de eje x que he utilizado aquí, para empezar. Además de una explicación en una figura de leyenda explicando lo que había marcado en él.)

--

Una última parcela:

histogram with stripchart

--

Mi maquina se generan en R.

Editar:

Como @gung supuso, abline(v=mean... fue utilizado para dibujar la media de la línea a través de la trama y rug fue utilizado para dibujar los valores de los datos (aunque realmente utilizo rug(jitter(... debido a que los datos fueron redondeadas a números enteros).

He aquí una manera de hacer el boxplot entre el histograma y el eje:

hist(Davis2[,2],n=30)
boxplot(Davis2[,2],
  add=TRUE,horizontal=TRUE,at=-0.75,border="darkred",boxwex=1.5,outline=FALSE)

Yo no voy a la lista de lo todo lo que hay, pero usted puede comprobar los argumentos de la ayuda (?boxplot) para averiguar lo que están, y jugar con ellos usted mismo.

Sin embargo, no es una solución general - no tengo la garantía de que siempre va a funcionar tan bien como lo hace aquí (nota: ya he cambiado el at y boxwex opciones*). Si usted no escribe una función inteligente para hacerse cargo de todo, es necesario prestar atención a lo que todo hace para asegurarse de que está haciendo lo que usted quiere.

He aquí cómo crear los datos que he utilizado (yo estaba tratando de mostrar cómo Theil de regresión fue realmente capaz de manejar varios influyentes outliers). Que acaba de pasar a ser de los datos de que estaba jugando conmigo cuando lo he contestado a esta pregunta.

 library("car")
 add <- data.frame(sex=c("F","F"),
       weight=c(150,130),height=c(NA,NA),repwt=c(55,50),repht=c(NA,NA))
 Davis2 <- rbind(Davis,add)

* -- un valor adecuado para at es de alrededor de -0.5 veces el valor de boxwex; que sería un buen valor por defecto si se escribe una función para hacerlo; boxwex tendría que ser modificada en una forma que se relaciona con el eje de la escala (altura) de la boxplot; te sugiero 0.04 a 0.05 veces la parte superior y límite puede a menudo estar bien.

Código para el marginal stripchart:

 hist(Davis2[,2],n=30)
 stripchart(jitter(Davis2[,2],amount=.5),
       method="jitter",jitter=.5,pch=16,cex=.05,add=TRUE,at=-.75,col='purple3')

3voto

Dave Puntos 69

Por supuesto usted puede. Sólo asegúrese de etiqueta/indican claramente lo que significa la línea y evitar que la trama demasiado 'ocupado'.

Nada es peor que un gráfico que transmite demasiada información para ser fácilmente comprensible. La tabla es una manera a menudo pasada por alto para mostrar las estadísticas de resumen en un asunto claro y conciso.

2voto

Nick Cox Puntos 22819

Las respuestas anteriores son excelentes puntos, pero aquí es fundamental para ser añadido.

La media es el centro de gravedad de una distribución y, entonces, el punto de pivote de un histograma. Es donde la distribución de equilibrio. Por lo tanto, hay una relación recíproca: no sólo puede la media ayudarle a pensar acerca de un histograma, por lo que también puede un histograma ayudarle a pensar acerca de la media. Este es quizás aún más útil cuando una distribución es asimétrica y la media de la distribución no es necesariamente en el medio.

1voto

simon Puntos 5346

No veo ningún problema con él, vea este estey este como ejemplos.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X