Estoy tratando de llegar con una métrica para medir la no-uniformidad de distribución para un experimento que estoy corriendo. Tengo una variable aleatoria que deben ser distribuidos de manera uniforme en la mayoría de los casos, y me gustaría ser capaz de identificar (y posiblemente medir el grado de) ejemplos de conjuntos de datos donde la variable no está uniformemente distribuido dentro de un cierto margen.
Un ejemplo de tres series de datos de cada uno con 10 mediciones en representación de la frecuencia de la ocurrencia de algo estoy de medición podría ser algo como esto:
a: [10% 11% 10% 9% 9% 11% 10% 10% 12% 8%]
b: [10% 10% 10% 8% 10% 10% 9% 9% 12% 8%]
c: [ 3% 2% 60% 2% 3% 7% 6% 5% 5% 7%] <-- non-uniform
d: [98% 97% 99% 98% 98% 96% 99% 96% 99% 98%]
Me gustaría ser capaz de distinguir las distribuciones como c de aquellos que, como a y b, y de la medida c de la desviación de una distribución uniforme. De forma equivalente, si no hay una métrica para la uniformidad de distribución es (std. la desviación de cerca de cero?), Tal vez puedo utilizar para distinguir aquellos con alta varianza. Sin embargo, mis datos sólo puede tener uno o dos valores atípicos, como la c ejemplo de arriba, y no estoy seguro de si esto va a ser fácilmente detectables de esa manera.
Puedo hackear algo para hacer esto en el software, pero estoy buscando métodos estadísticos/enfoques para justificar esta formalmente. Tomé una clase de años, pero las estadísticas no es mi área. Esto parece como algo que debe tener un bien conocido enfoque. Lo siento si algo de esto es completamente hueso de la cabeza. Gracias de antemano!