9 votos

Los conjuntos de datos para los ejemplos de visualización de datos, la enseñanza y la investigación

Estoy en busca de conjuntos de datos existentes que podemos utilizar para probar varios datavis técnicas que estamos investigando.

Conozco a varios recursos como los incluidos en R (intente plot(Orange) o ver aquí).

Pero me gustaría dar un paso adelante:

  • Que son los mejores del mundo real de los conjuntos de datos de prueba de una herramienta de visualización?
  • Qué conjuntos de datos se han utilizado en trabajos académicos o de enseñanza diapositivas sobre datavis?
  • Que es el mejor ejemplo del mundo real para mostrar las ventajas de la representación gráfica?

9voto

simmosn Puntos 304

Me gusta usar la Anscombe conjuntos de datos (también disponible en R), para mostrar la importancia de planear al hacer regresiones. Si usted no está familiarizado, se obtiene la misma línea de regresión y el diagnóstico de los cuatro conjuntos de datos, aunque los conjuntos de sí mismos un aspecto bastante diferente. Usted puede tomar las parcelas de abajo y convertirlos en gráficos de residuos para ilustrar los problemas que usted puede buscar en los residuos después de la realización de una regresión.

Anscombe data sets

6voto

Bryan Rehbein Puntos 3947

que es el mejor ejemplo del mundo real para mostrar las ventajas de la representación gráfica?

Cualquier mesa grande. Por ejemplo, en google imágenes de "censo oficial de mesa". Vas a ver cosas como la que aparece a continuación.

También mira Gelman et al. (2002) Vamos a Practicar Lo que Predicamos: convertir las Tablas en forma de Gráficos. Estadístico Americano 56:121-130

huge complicated table

4voto

Pankaj Kumar Puntos 150

Posiblemente usted ya sabe de estos, pero aquí están de todos modos:

La UCI Machine Learning Repository tiene muchas públicamente accesible, del mundo real, conjuntos de datos.

El Gobierno de estados unidos hace que muchos de sus conjuntos de datos públicos en data.gov.

Si quieres un poco difícil la visualización de datos, te sugiero buscar en una tarea de clasificación. A mí me parece que la Bolsa de Palabras establecido en la UCI de MLR tiene algunas propiedades, pero puedo estar equivocado (pasado un tiempo desde que he usado).

4voto

Zizzencs Puntos 1358

William S. Cleveland tiene dos libros llenos de grandes aplicaciones de gráficos y los datos y el código para crear los gráficos en la visualización de datos se encuentra en su página web

2voto

Brendan Puntos 7674

Me he dado cuenta de un montón de conjuntos de datos aquí:

http://www.inside-r.org/howto/finding-data-internet

No sé si eso es de alguna utilidad?

Me temo que no enseño la visualización, así que no puedo comentar sobre sus preguntas específicas.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X