Me ha costado mucho encontrar una buena representación (visual o analítica) para muchos puntos de datos en un espacio muy pequeño, discreto Por ejemplo, dado un conjunto de resultados de 1 a 5 en incrementos de 1,0, todos los enfoques tradicionales que he probado para desglosar esos datos dan lugar a resultados muy poco accionables.
- La naturaleza discreta de los puntos de datos hace que la mediana sea prácticamente inútil, ya que cualquiera que sea el resultado ocupa el 25% del espacio de resultados (el más bajo es 1,0, el más alto es 5,0), lo que me lleva a utilizar la media en su lugar.
- Intenté utilizar algún tipo de gráfico de caja y bigotes (sustituyendo la inútil mediana por la media) para visualizar los datos, pero aquí el cuartil superior y el cuartil inferior suelen coincidir con los puntos de datos más bajos y más altos, lo que resta valor al gráfico.
Actualmente utilizo un gráfico de dispersión ponderado para visualizar los resultados, pero creo que debería haber un método más eficaz para destilar los datos, así como una representación numérica que no dependa de la percepción del tamaño para transmitir el punto.
(A pesar de las similitudes, no estoy tratando con clasificaciones y no tengo la opción de cambiar la naturaleza de los datos. Se trata de puntuaciones AP del College Board. Por lo general, las calificaciones están destinadas a ser comparadas a través de los elementos, por lo que se puede utilizar la media ponderada de recuento para clasificar los conjuntos de datos, pero mi deseo aquí es visualizar los datos dentro de un único conjunto de datos, por ejemplo, no "¿qué tan bien lo hicieron los estudiantes en Química frente a Historia de los Estados Unidos?", sino más bien "¿qué más podemos aprender sobre el rendimiento de los estudiantes en el examen de Química?").