26 votos

Visualización de los datos de respuesta a los ítems Likert

¿Cuáles son las buenas formas de visualizar un conjunto de respuestas Likert?

Por ejemplo, ¿un conjunto de ítems en los que se pregunte por la importancia de X para las decisiones de uno sobre A, B, C, D, E, F y G? ¿Hay algo mejor que los gráficos de barras apilados?

  • ¿Qué se debe hacer con las respuestas de N/A? ¿Cómo se pueden representar?
  • ¿Los gráficos de barras deben indicar los porcentajes o el número de respuestas? (es decir, ¿las barras deben tener la misma longitud?)
  • Si se trata de porcentajes, ¿se deben incluir en el denominador las respuestas no válidas y/o nulas?

Tengo mis propios puntos de vista, pero busco las ideas de otras personas.

32voto

erik Puntos 3923

Me gusta la vista centrada en el recuento. Esta versión en particular elimina las respuestas neutrales (tratando efectivamente lo neutral y n/a como lo mismo) para mostrar sólo la cantidad de opiniones de acuerdo/desacuerdo. El punto 0 está donde se unen el rojo y el azul. El eje de recuento está recortado.

alt text

A modo de comparación, aquí están las mismas cinco respuestas en forma de porcentajes apilados, mostrando tanto la neutralidad (gris) como la ausencia de respuesta (blanco).

alt text

Actualización: Documento que sugiere un método similar: Trazado de Likert y otras escalas de valoración (PDF)

25voto

DavLink Puntos 101

Los gráficos de barras apilados suelen ser bien comprendidos por quienes no son estadísticos, siempre que se introduzcan con suavidad. Es útil escalarlos en una métrica común (por ejemplo, 0-100%), con un color gradual para cada categoría si se trata de elementos ordinales (por ejemplo, Likert). Prefiero gráfico de puntos (diagrama de puntos de Cleveland), cuando no hay demasiados elementos y no hay más de 3-5 categorías de respuestas. Pero en realidad es una cuestión de claridad visual. Generalmente proporciono el %, ya que es una medida estandarizada, y sólo informo tanto del % como de los recuentos con un gráfico de barras no apilado. He aquí un ejemplo de lo que quiero decir:

data(Environment, package="ltm")
Environment[sample(1:nrow(Environment), 10),1] <- NA
na.count <- apply(Environment, 2, function(x) sum(is.na(x)))
tab <- apply(Environment, 2, table)/
       apply(apply(Environment, 2, table), 2, sum)*100
dotchart(tab, xlim=c(0,100), xlab="Frequency (%)", 
         sub=paste("N", nrow(Environment), sep="="))
text(100, c(2,7,12,17,22,27), rev(na.count), cex=.8)
mtext("# NA", side=3, line=0, at=100, cex=.8)

alt text

Se podría conseguir una mejor representación con lattice o ggplot2 . Todos los ítems tienen las mismas categorías de respuesta en este ejemplo particular, pero en un caso más general podríamos esperar que fueran diferentes, de modo que mostrarlas todas no parecería redundante como ocurre aquí. No obstante, sería posible dar el mismo color a cada categoría de respuesta para facilitar la lectura.

Pero yo diría que los gráficos de barras apilados son mejores cuando todos los ítems tienen la misma categoría de respuesta, ya que ayudan a apreciar la frecuencia de una modalidad de respuesta en todos los ítems:

alt text

También se me ocurre algún tipo de mapa de calor, que es útil si hay muchos artículos con una categoría de respuesta similar. alt text

Las respuestas perdidas (especialmente cuando no son insignificantes o están localizadas en un ítem/pregunta específico) deben ser reportadas, idealmente para cada ítem. Generalmente, el porcentaje de respuestas para cada categoría se calcula sin NA. Esto es lo que se suele hacer en encuesta o psicometría (se habla de "respuestas expresadas u observadas").

P.D. Se me ocurren cosas más rebuscadas como la foto que se muestra a continuación (la primera fue hecha a mano, la segunda es de ggplot2 , ggfluctuation(as.table(tab)) ), pero no creo que transmita una información tan precisa como el dotplot o el barchart, ya que las variaciones superficiales son difíciles de apreciar. alt text

alt text

14voto

Scott Cowan Puntos 1564

La respuesta de chl me parece genial.

Una cosa que podría añadir, es que para el caso de que quieras comparar la correlación entre los elementos. Para eso puedes usar algo como un Matriz de dispersión de correlación para datos ordenados por categorías

alt text

(Este código aún necesita algunos retoques, pero da la idea general...)

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X