Este artículo describe el 'intervalo de confianza de la puntuación de Wilson', y describe cómo usarlo para derivar el límite inferior en el intervalo de confianza percentil para determinar criterios de clasificación para calificaciones tipo pulgar arriba/pulgar abajo en un sistema de calificación.
¿Cómo se puede generalizar esto a un sistema de calificación que no forma una distribución binomial? Específicamente, ¿cómo se puede determinar esto cuando cada calificación es un número real entre 0 y 1, o cuando cada calificación es una de un conjunto de calificaciones discretas (por ejemplo, 1, 2, 3, 4 o 5)?
Con una distribución normal, parece que esto podría ser simplemente el promedio menos algunos número de desviaciones estándar - pero según mi conocimiento, no es una verdadera distribución normal, ya que está limitada al rango (0, 1).