5 votos

Gráficos vs punto parcelas

Entiendo las críticas de los gráficos de sectores como la que se hace referencia aquí: Problemas con los gráficos circulares

Sin embargo, la respuesta anterior (y el R manual) siempre citar punto de parcelas de Cleveland como una alternativa. Mi pregunta es ¿por qué punto de parcelas consideradas una alternativa? Parece ser que el punto de parcelas sólo se aplicarán cuando:

  1. el conjunto de datos es relativamente pequeño (por lo que puede tal vez incluso por el ojo de recuento de puntos en el diagrama, cada punto corresponde a un punto de datos, y

  2. ellos no están destinados para mostrar porcentajes / estimaciones de densidad de datos.

Me parece que el objetivo principal del gráfico circular (incluso si lo hace mal) para resaltar el hecho de que las categorías deben sumar 1 o 100%. con el punto de parcelas puede mostrar el cardenal valor de cada categoría, pero no es evidente a qué fracción de todas las categorías de un determinado valor. También, con un gráfico circular no importa si usted tiene 10 puntos de datos o 1.000.000, donde como un diagrama de puntos con un millón de puntos (incluso si el número de categorías es pequeño) parece extraño y sólo podría colapsar a un gráfico de barras.

Podría alguien explicar por qué los puntos de las parcelas son vistos como una alternativa y tal vez se ofrecen algunos ejemplos de punto de parcelas a otras cuantitativo de alternativas a los gráficos circulares (como la barra de parcelas?)

7voto

user2735206 Puntos 51

Greg Nieve respuesta ha cubierto mucho acerca de la diagrama de puntos. Me gustaría sugerir una alternativa que puede comprimir la dimensión más:

enter image description here

Lo siento, la leyenda es falta, pero la idea es bastante aquí. En lugar de mostrar las cuatro piezas de datos en cuatro líneas horizontales, los podemos poner en una línea con acumulado un porcentaje de la escala. De esta manera, la diferencia entre los puntos de permitir la comparación cuantitativa como de costumbre punto de parcelas hacer. Además, se puede superar la dificultad de la comparación de varios gráficos circulares: si necesitamos mostrar los datos de otra entidad, que sólo podría agregar una línea horizontal en la ilustración.

Código de referencia:

library(lattice)
perc <- c(100, 60, 30, 10)
setnum <- rep(1,4)
category <- c("A", "B", "C", "D")
dotplot(setnum ~ perc, group=category, xlim=c(-5,105),ylab="", xlab="Cumulative %", pch=16)

7voto

Eero Puntos 1612

Hay dos diferentes tipos de gráfico que se conoce como 'dotplots', y yo creo que usted está recibiendo los dos confundidos. El tipo de dotplot de que parece que están pensando es en realidad una variación de un histograma y no expresa el mismo tipo de información que un gráfico circular haría.

El tipo de dotplot de Cleveland es esencialmente un gráfico de barras con un punto colocado en el extremo de cada barra, entonces la barra se quita. Así que incluso con millones de puntos de datos, que sería presentado el mismo que para crear un gráfico circular, un único punto se traza para cada categoría. El resumen de la preparación de la trama es la misma que en un gráfico de tarta y un dotplot: la diferencia está en un gráfico circular que se trata de comparar los no alineados ángulos o áreas (y la tentación de agregar chartjunk o de otra forma, distorsionar la percepción de los valores es mucho mayor) y en el dotplot se comparan los puntos en un alineados escala.

Si desea que el espectador sea capaz de juzgar porcentaje de la totalidad de la continuación, sólo asegúrese de que el eje para el punto de las posiciones va desde 0 hasta el total de la cuenta. También puede agregar fácilmente otro de los ejes (o reemplazar el principal) que muestra el porcentaje más de la cuenta, entonces el porcentaje se puede leer que el eje mucho más precisa que la estimación de ángulos y áreas en los diagramas circulares.

Aquí hay un par de ejemplos de uso R:

Este es el tipo de dotplot que creo que usted está pensando, y este no iba a reemplazar un gráfico circular:

library(TeachingDemos)
dots(round( rnorm(100),0 ) )

enter image description here

Pero este es el tipo de dotplot de ser mencionado en Cleveland como un reemplazo para gráficos circulares:

# steal data from ?pie
pie.sales <- c(0.12, 0.3, 0.26, 0.16, 0.04, 0.12)
names(pie.sales) <- c("Blueberry", "Cherry",
    "Apple", "Boston Cream", "Other", "Vanilla Cream")
par(mfrow=c(2,1))
dotchart(pie.sales*100)
# or
par(xaxs='i')
dotchart( pie.sales*100, xlim=c(0,100) )

enter image description here

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X