Estoy trabajando en la creación de un sitio web, que muestra los datos del censo para un usuario seleccionado polígonos y le gustaría mostrar gráficamente la distribución de varios parámetros (un gráfico por parámetro).
Los datos suelen tener las siguientes propiedades:
- El tamaño de la muestra suele ser grande (por ejemplo, unos 10.000 puntos de datos)
- El rango de valores tiende a ser bastante grande (por ejemplo, la población mínima puede ser inferior a 100 y la máxima puede ser algo así como 500.000)
- q1 suele estar cerca del mínimo (digamos 200) mientras que q2 y q3 estarán dentro de los 10.000
- No se parece en nada a una distribución normal
No soy estadístico y, por tanto, mi descripción puede no ser exactamente clara.
Me gustaría mostrar esta distribución en un gráfico, que será visto por los ciudadanos (los legos, si se quiere).
Me hubiera gustado más utilizar un histograma, pero no es posible debido al gran rango de valores, por lo que hacer bins no es realmente fácil y sencillo.
Por lo poco que sé de estadística, un diagrama de caja es lo que se suele utilizar para mostrar este tipo de datos, pero creo que para un profano, descifrar el diagrama de caja no es fácil.
¿Qué opciones tengo para mostrar estos datos de forma fácil de entender?
0 votos
¿Qué es exactamente lo que muestra? No me queda claro qué tipo de datos representa su único punto de datos.
1 votos
¿Qué tal un gráfico de densidad del núcleo? statmethods.net/graphs/density.html
0 votos
@mpiktas: Mis datos son los del Censo de los pueblos. Mi sitio web permitirá al usuario seleccionar un área en el mapa, y luego encontrará todos los pueblos en esa área. Los datos del censo de un pueblo consisten en varios valores como: Población masculina, población femenina, ingresos medios de los hogares, etc., de ese pueblo. Espero mostrar la distribución de los datos de un valor concreto (por ejemplo, la población total) para todos los pueblos que se encuentran en la zona seleccionada por el usuario.