22 votos

Buen recurso en línea con consejos para representar gráficamente la asociación entre dos variables numéricas en diversas condiciones.

Contexto:

A lo largo del tiempo he adquirido un conjunto de heurísticas sobre cómo trazar eficazmente la asociación entre dos variables numéricas. Imagino que la mayoría de las personas que trabajan con datos tendrán un conjunto de reglas similar.

Ejemplos de estas normas podrían ser:

  • Si una de las variables está sesgada positivamente, considere la posibilidad de trazar ese eje en una escala logarítmica.
  • Si hay muchos puntos de datos (por ejemplo, n > 1000), adopte una estrategia diferente, como utilizar algún tipo de transparencia parcial o muestrear los datos;
  • Si una de las variables adopta un número limitado de categorías discretas, considere la posibilidad de utilizar un gráfico de fluctuación o de girasol;
  • Si hay tres o más variables, considere la posibilidad de utilizar una matriz de dispersión;
  • A menudo resulta útil ajustar algún tipo de línea de tendencia;
  • Ajuste el tamaño del carácter de trazado al tamaño de la muestra (para n más grandes, utilice un carácter de trazado más pequeño);
  • etc.

Pregunta:

Me gustaría poder remitir a los alumnos a una página o sitio web que explique estos y otros trucos para trazar eficazmente asociaciones entre dos variables numéricas, quizá con ejemplos.

  • ¿Existen páginas o sitios en Internet que hagan un buen trabajo al respecto?

13voto

Robert Dean Puntos 1523

No puedo pensar en grandes recursos en línea de la parte superior de mi cabeza, pero un capítulo de libro agradable (y fácilmente descargable) que narra cómo explorar visualmente un gran conjunto de datos multidimensionales de una manera reflexiva es Capítulo de Brendan O'Connor y Lukas Biewald (advertencia: el enlace remite directamente a un PDF) de Datos hermosos . El capítulo es especialmente útil como recurso didáctico porque incorpora código R a la narración.

Además, pensándolo bien, creo que el clásico de John Tukey "Algunas pantallas gráficas y semigráficas" (convenientemente publicado en el sitio web de Edward Tufte) es una introducción a la visualización realmente maravillosa, aunque algo idiosincrásica.

Por alguna razón, me parece estar pensando en capítulos de libros...

11voto

Hertanto Lie Puntos 965

Referencias recientes:

Recursos más antiguos, pero pertinentes

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X