Estoy implementando un sistema de calificación para mi sitio web, y creo que la media bayesiana es la mejor manera de hacerlo. Cada artículo será valorado en seis categorías diferentes por los usuarios. Sin embargo, no quiero que los artículos con una sola calificación alta se disparen a la cima, por lo que quiero implementar un sistema bayesiano.
Esta es la fórmula:
Bayesian Rating = ( (avg_num_votes * avg_rating) + (this_num_votes * this_rating) ) / (avg_num_votes + this_num_votes)
Dado que los elementos se calificarán en 6 categorías diferentes, ¿debo utilizar la media de las sumas de esas categorías como "this_rating" para el sistema bayesiano? Por ejemplo, tomemos un elemento con dos calificaciones (escala de 0 a 5):
Rating 1:
Category A: 3
Category B: 1
Category C: 2
Category D: 4
Category E: 5
Category F: 3
Sum: 18
Rating 2:
Category A: 2
Category B: 3
Category C: 3
Category D: 5
Category E: 0
Category F: 1
Sum: 14
¿Debería "este_rating" ser simplemente la media de las sumas indicadas anteriormente? ¿Es correcto lo que pienso, o debería implementarse un sistema bayesiano para cada categoría también (o es que lo estoy pensando demasiado)?