Después de leer "Cómo No Ordenar por puntuación Media" (http://www.evanmiller.org/how-not-to-sort-by-average-rating.html), tenía curiosidad por saber si hay la misma cosa para las variables con más de dos resultados (0,1) o incluso de las variables continuas.
Por ejemplo, ¿cómo podría generalizar el límite inferior a la de Amazon problema ? Claramente hay 5 resultados (uno para cada número de estrellas, dado por el usuario). En qué medida se puede utilizar para realizar el 4.5 estrellas con más de 2000 votos mejor clasificado que el hotel de 5 estrellas con 2 votos ?
También, me parece que este tipo de problema puede tener una interpretación bayesiana. Me refiero a usar la fórmula de "Cómo no" no está lejos de configuración antes en la distribución, tal vez una de Bernoulli con parámetro inferirse sobre todo el conjunto de datos / categoría pertenece el artículo ? ¿Alguien sabe una referencia para este problema en particular ?