No existe una única forma aceptada de abordar esta cuestión. El compromiso obvio es la valoración media frente a la precisión de la valoración reflejada en su número. Así, se puede preferir un producto cuya valoración media sea ligeramente inferior, pero que haya sido valorado con mucha más frecuencia, lo que proporciona más confianza en que la valoración media es razonable.
Una solución para resolver este problema es utilizar el rango inferior del 95%. intervalo de confianza de la calificación. Para cada producto $i$ se puede calcular con la siguiente expresión: $$\text{Score}_i=\bar{x}_i-1.96*\frac{\sigma_i}{\sqrt{n_i}},$$ donde $\bar{x}_i$ es la calificación media del producto $i$ , $\sigma_i$ es la desviación estándar, y $n_i$ es el número de valoraciones del producto $i$ .
Tenga en cuenta que, si $n_i$ es muy grande, la puntuación converge a la calificación media $\bar{x}_i$ . Para los productos con muy pocas valoraciones ( $n_i$ pequeña), la puntuación es menor que la calificación media, y es más pequeña cuanto menos calificaciones tenga y cuanto más discrepen estas calificaciones (medido por la desviación estándar $\sigma_i$ ). Así, la puntuación combina la valoración media y el número de valoraciones en un solo número, según el cual se pueden clasificar los productos. Esto también significa que un producto con una valoración media más baja puede estar mejor clasificado, porque tiene más valoraciones y, por lo tanto, usted está más seguro de que la valoración media es sólida.
Por último, ¿por qué el factor 1,96? Bueno, para sus fines podría cambiar este factor a un número mayor o menor, castigando así menos o más a los productos con menos valoraciones. Este número es el adecuado si se calcula un intervalo de confianza del 95% bajo el supuesto de que las valoraciones se distribuyen normalmente. Pero como a usted no le interesan las pruebas estadísticas, el factor exacto no es tan importante: es el habitual de la estadística.