7 votos

Partido gráfico de calidad

Hay un artículo de Forbes sobre el estudiante universitaria de calidad del partido que contiene un interesante gráfico basado en un documento de trabajo por Eleanor Dillon y Jeff Smith.

La descripción se lee:

El gráfico de abajo, que representa a personas que asistió a la universidad en la década de 2000, los detalles de cómo los estudiantes en diversas capacidad cuartiles (medido por un amplio prueba de aptitud) corresponden a colegio de la calidad de los cuartiles. Perfecto maridaje tendría lugar el 25% de la la población estudiantil en cada círculo a lo largo de la diagonal, con los estudiantes no en los demás círculos.

Alrededor del 36 por ciento de los estudiantes son adecuadamente, se "corresponden" a las universidades basado en la capacidad. Alrededor del 36 por ciento de los estudiantes son adecuadamente se "corresponden" a las universidades, basado en la capacidad. Los estudiantes, tanto en la parte superior capacidad cuartil y la parte superior universitario de la calidad cuartil representan el 11% de el total de la población de estudiantes, o el 44% de todos los estudiantes en la parte superior capacidad cuartil. En general, el 36% de los estudiantes asisten a una universidad en su la calidad correspondiente cuartil, y el 77% de asistir a una escuela dentro de una cuartil de su capacidad de grupo.

Aquí está la lista de Forbes gráfico: match quality

Traté de mejorar en este gráfico ya que me parece circular en zonas de difícil comparar y quería ver no sólo el porcentaje absoluto, pero los marginales así. Aquí está mi intento:

enter image description here

Yo no se molestó en hacer el partido de sombra (no estoy seguro de que hay una buena métrica), pero creo que mi gráfica no satisfactorio. Se requiere una gran cantidad de aritmética para obtener ideas.

¿Cómo podría usted mostrar estos datos?

    cq   sa    pct  
     1    1   10.6  
     1    2    7.1  
     1    3    5.2  
     1    4      3  
     2    1    6.8  
     2    2    6.5  
     2    3    6.4  
     2    4    4.3  
     3    1      4  
     3    2    6.9  
     3    3    7.4  
     3    4    7.4  
     4    1    2.1  
     4    2    4.6  
     4    3    6.5  
     4    4   11.4  

5voto

Sean Hanley Puntos 2428

A mí me parece que vale la pena destacar que estos son, en esencia, de acuerdo a datos. Debemos utilizar un complot diseñado para la visualización y la evaluación de dichos datos. La parcela estoy más familiarizado con este fin es el Bangdawala acuerdo del gráfico. Usted puede encontrar que se discute aquí:

En R, se puede crear uno con ?agreementplot en la vcd paquete. (Sé que se puede hacer en SAS uso de la AGREE opción PROC FREQ, y estoy seguro de que hay Stata macros para ella también.)

library(vcd)
d = read.table(text="cq   sa    pct  
...  
4    4   11.4", header=T)
tab = xtabs(pct~cq+sa, d)

windows()
  agreementplot(tab)

## you can also get the Bangdiwala B agreement statistics: 
print(agreementplot(tab))
# $Bangdiwala
#           [,1]
# [1,] 0.1352742
# 
# $Bangdiwala_Weighted
#           [,1]
# [1,] 0.5426176
# 
# $weights
# [1] 1.0000000 0.8888889

enter image description here

Algunas cosas a tener en cuenta a partir de esta gráfica son:

  1. Los rectángulos que se encuentran a lo largo de la diagonal roja. Esto significa que ninguna de estas medidas es sistemáticamente más alta o más baja que las otras. (Que es, ni es una medida sesgada de la otra.)
  2. La pesada rectángulos negros son una muy pequeña proporción de la zona exterior de la rectángulos, lo que indica que la coincidencia de los estudiantes a las escuelas está lejos de ser perfecto.
  3. (Los rectángulos grises representan parcial—off'por 1'—de acuerdo.)

3voto

erik Puntos 3923

Creo que la mayor debilidad de la original es que la intensidad de color que domina nuestra percepción aunque es prácticamente de sentido en que se duplica la información que ya está representado por las posiciones. Me imagino que conduce a su insatisfacción y la búsqueda de alternativas.

Aquí es una versión de la intensidad del color para la cuenta en lugar de utilizar el tamaño de cuenta.

categorical heat map

Se hace un trabajo decente de mostrar la cuenta de caer fuera de la diagonal, y que los cuartiles 2 y 3 no son diferentes. Ni el color de la zona es muy fácil de percibir con precisión, pero cambié de área de color de porcentajes porque es más "una mirada capaz de" para el reconocimiento de patrones. He utilizado colores discretos en lugar de continuo colores para enmascarar lo que me juzgan sin sentido variaciones.

Mirando marginales, me estoy dando cuenta que es más fácil ver los patrones en distintos gráficos de barras que en superpuestos y líneas-no sé por qué.

enter image description here

enter image description here

Con un poco de esfuerzo, es posible que funcione para anexar las barras de los gráficos para dos bordes del mapa de calor para un verdadero "marginal" efecto.

Líneas hacen más fácil pensar en términos de lo que sucede cuando la variable X cambia de valor para el siguiente.

enter image description here

Los datos parece demasiado gruesa a ir muy lejos con una visualización.

1voto

Judioo Puntos 625

Creo que el actual gráficos muestran los datos bastante bien. El gráfico de barras apiladas tiene buen progresiones es más fácil seguir a lo largo de la mayoría de los gráficos de barras apiladas. El original de la burbuja gráfico muestra que existe una correlación razonable entre los dos (he calculado que en el 0,36).

Una alternativa es un diagrama de puntos/línea de gráfico.

enter image description here

Una cosa que me gusta de esto es la capacidad de tendencia y, a continuación, la trama de las mismas líneas. (Así que usted puede ver las desviaciones de lo esperado, como oppossed simplemente bivariado porcentajes.) No estoy seguro de lo razonable de que modelo es, sin embargo. Un modelo predeterminado son los residuos de la cruz-ficha de la tabla, en este caso sólo se replica el gráfico original, aunque.

enter image description here

Me llama la atención (tanto de la burbuja original de la trama y de este punto del gráfico) que no es más binning en los extremos, pero no estoy seguro de la forma de mano de cuantificar.

Siempre hay más cosas que usted podría hacer (como un gráfico de la red que tiene los dos cuartil conjuntos de nodos y muestra ponderada líneas). Pero creo que estos ejemplos son, básicamente, todo lo que usted necesita.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X