Contexto:
A lo largo del tiempo he adquirido un conjunto de heurísticas sobre cómo trazar eficazmente la asociación entre dos variables numéricas. Imagino que la mayoría de las personas que trabajan con datos tendrán un conjunto de reglas similar.
Ejemplos de estas normas podrían ser:
- Si una de las variables está sesgada positivamente, considere la posibilidad de trazar ese eje en una escala logarítmica.
- Si hay muchos puntos de datos (por ejemplo, n > 1000), adopte una estrategia diferente, como utilizar algún tipo de transparencia parcial o muestrear los datos;
- Si una de las variables adopta un número limitado de categorías discretas, considere la posibilidad de utilizar un gráfico de fluctuación o de girasol;
- Si hay tres o más variables, considere la posibilidad de utilizar una matriz de dispersión;
- A menudo resulta útil ajustar algún tipo de línea de tendencia;
- Ajuste el tamaño del carácter de trazado al tamaño de la muestra (para n más grandes, utilice un carácter de trazado más pequeño);
- etc.
Pregunta:
Me gustaría poder remitir a los alumnos a una página o sitio web que explique estos y otros trucos para trazar eficazmente asociaciones entre dos variables numéricas, quizá con ejemplos.
- ¿Existen páginas o sitios en Internet que hagan un buen trabajo al respecto?