8 votos

¿Cómo debe esta BBC gráfico (Brexit correlación entre la educación y los resultados) se han preparado?

La BBC ha analizado más Brexit referéndum de datos; el primer gráfico en su artículo llamó mi atención:

enter image description here

Parecía extraño que dividir el eje de las x en un 50%. Sin duda, esto debería haber sido dividida en la mediana de los datos? (O la media si los datos se distribuye normalmente; pero entrecerrando los ojos en él, que no parece ser el caso aquí.)

(Aún no publicó sus datos, pero una rápida en google sugiere a los graduados es de aproximadamente 25% de la población adulta, y que coincide con los ojos-balling el gráfico, así que voy a ir con eso.)

Pero que me puso a pensar de cómo elaborar este gráfico tan objetivamente como sea posible. Sería mejor mantener el eje de las x es lineal, y tiene las dos casillas de la derecha tres veces tan ancho? O guardar las cajas del mismo tamaño, y aplastar y estirar el eje x, de modo que cada N de píxeles abarca el mismo número de puntos de datos? O algo más?

11voto

Gordon Smyth Puntos 170

Estoy de acuerdo en que colorear los cuadrantes rosa es en gran parte estética, pero en general lo veo como una clara informativo de la parcela. El mensaje es inmediatamente evidente, y no es engañosa. La BBC ha representado los puntos de datos reales. No han manipulado los ejes x y y. La anotación en la trama es correcta y no exagerado. No han añadido espurio líneas de tendencia o cualquier otro innecesaria la interpretación. En comparación con la mayoría de los datos de las cifras presentadas en los medios de comunicación, esta trama es excelente, es un buen ejemplo de dejar que los datos hablen por sí mismos. En resumen, creo que eres de sobre-pensar. No me cabe duda de que usted puede encontrar algunas maneras de mejorar la trama, pero lo simple es lo mejor.

4voto

N.N.Thoughts Puntos 49

Estoy de acuerdo en que la gráfica es engañosa en el sentido de que se pretende demostrar que no hay puntos de datos en el cuadrante categóricamente descrito como alto de salir de voto %, alto % de los graduados. ¿Qué es la alta y la baja se vuelve relativo a los límites del eje, no los datos reales. Aunque teóricamente es posible tener un barrio con una población que es 100% educación universitaria, ward no existe. Usted no necesita inventar puntos de datos para producir una engañosa gráfico: una fractura de un eje que muestra exagerada de cambio es un ejemplo de que no es demasiado diferente de la de este.

Forma más objetiva, para visualizar estos datos sería configurar el gráfico de dispersión de los límites de los ejes en el max / min de los datos y, a continuación, dividir la tabla en cuadrantes de igual área.

La razón por la que me iría a por el área igual a la de los cuadrantes es así que los cuadrantes mostrar un equivalente de la relación lineal entre las variables. De la categoría de las descripciones de los cuadrantes, "alta" y "baja" son tratados como equivalentes para las áreas debe ser así.

Si por el contrario queremos usar cuadrantes como otra manera de describir cuantitativamente los datos, podemos establecer el cuadrante de las fronteras en el promedio de cada variable, como se muestra en la Visualización de Datos con R: 100 ejemplos (para obtener una vista previa en Google Libros, p283,286).

Para agregar otro analítico de la capa a un gráfico de dispersión de la visualización, podemos utilizar el color y tamaño de los puntos. Por ejemplo, el color puede utilizarse para separar de la universidad de los pueblos del resto, muestran la participación de los votantes en un gradiente o resaltar General de los resultados de la Elección para los barrios. No estoy seguro de si el tamaño se hará efectiva con tantos puntos de datos, pero que potencialmente puede investigar de población diferentes grupos, por ejemplo, de 65 años, y cómo son representados en los datos.

A mi mente también hay dos advertencias importantes pena tener en cuenta cuando se busca en este gráfico: en primer lugar, que cuenta con todos los graduados, independientemente de que se votó en el referéndum o no, y en segundo lugar, que incluye a los residentes graduados con pasaportes de la UE, que no se podía votar en el referéndum (suponiendo que la fuente de datos es la base Censal).

2voto

Gregor Puntos 181

Estoy de acuerdo, muy engañosa. Me gustaría eliminar el color de fondo todos juntos.

Si usted insiste en la coloración, tal vez en un gradiente correspondiente a la densidad de población? Esto es, el color de fondo se vuelve más oscuro a medida que más salas de caer en el "educado vs salir de la categoría de"

Definitivamente hay una tendencia, no creo que nadie se podría argumentar en contra de que - tal vez el autor debe seguir con una línea de tendencia de algún tipo?

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X