Es una buena ocasión para tener un gran número de contenedores, por ejemplo, contenedores para cada valor posible, siempre que se sospecha que el detalle de un histograma no sería de ruido, pero muy interesante, importante o de estructura fina.
Esto no está directamente conectado a la precisa motivación para esta pregunta, con ganas de una regla automatizada para algún número óptimo de bandejas, pero es pertinente a la cuestión como un todo.
Vamos a hacernos saltar de inmediato a los ejemplos. En la demografía de redondeo de los casos denunciados de edades es común, especialmente, pero no sólo en los países con limitado nivel de alfabetización. Lo que puede suceder es que mucha gente no sabe su fecha exacta de nacimiento, o social o por motivos personales, ya sea para la comprensión o para exagerar su edad. La historia militar está llena de ejemplos de personas que mentir acerca de su edad, ya sea para evitar o a solicitar el servicio en las fuerzas armadas. De hecho, muchos lectores saben de alguien que es muy tímida o de otra manera no del todo veraz acerca de su edad, incluso si ellos no mienten acerca de un censo. El resultado neto varía, pero como ya implícita es generalmente de redondeo, por ejemplo, las edades terminados en 0 y 5 son mucho más comunes que las edades de un año más o menos.
Un fenómeno similar de preferencia de dígitos es común que incluso los muy diferentes problemas. Con algunos antiguos métodos de medición el último dígito de un reporte de la medición se mide por el ojo por interpolación entre graduado marcas. Este fue largo estándar en meteorología con los termómetros de mercurio. Se ha encontrado que, en conjunto, ha informado de algunos dígitos son más comunes que otros y que, individualmente, muchos de nosotros hemos firmas, un patrón personal de favorecer a algunos dígitos en lugar de los demás. La referencia usual de distribución de aquí es el uniforme, que es, mientras que la gama de posibles medidas es muchas veces mayor que la de la "unidad" de la medición, los dígitos finales se espera que ocurren con igual frecuencia. Así que si se ha informado a la sombra de las temperaturas podrían cubrir un rango de (digamos) el 50 $^\circ$C los diez últimos dígitos, fracciones de un grado .0, .1, $\cdots$, .8, .9 deben ocurrir con una probabilidad de 0.1. La calidad de esta aproximación debe ser bueno, incluso para un alcance más limitado.
Por cierto, viendo los últimos dígitos de los datos registrados es un simple y buen método de comprobación para el fabricado de datos, uno que es mucho más fácil de entender y menos problemático que el de la moda, el escrutinio de los primeros dígitos con una apelación a la Ley de Benford.
El resultado para los histogramas de ahora debe ser claro. Una forma de espiga presentación puede servir para mostrar, o más en general, para comprobar, este tipo de estructura fina. Naturalmente, si no hay nada de interés se observa, en el gráfico puede ser de poca utilidad.
Un ejemplo se muestra la edad colmadas de Ghana censo de 1960. Ver http://www.stata.com/manuals13/rspikeplot.pdf
No fue una buena revisión de las distribuciones de los dígitos finales en
Preece, D. A. 1981. Las distribuciones de los dígitos finales en los datos. El Estadístico 30: 31-60.
Una nota sobre la terminología: algunas personas escriben acerca de los valores únicos de una variable cuando sería mejor hablar acerca de los distintos valores de una variable. Los diccionarios y los manuales de uso avisar que "singular" significa que ocurre sólo una vez. Así, los distintos informó de edades de una población podría ser, en los años 0, 1, 2, etc. pero la gran mayoría de esas edades no va a ser exclusivo de una persona.