17 votos

El cálculo de la "Más Útil" revisión

¿Cómo podrías calcular el orden de una lista de comentarios ordenados por "Más Útiles" a "Menos Útiles"?

He aquí un ejemplo inspirado por los comentarios de este producto en Amazon:

Decir que un producto tiene 8 el total de los comentarios y los que están clasificados por "Más Útiles" a "Menos Útiles" basado en la parte que dice "x de y limpieza".

Aquí es cómo los comentarios están ordenados comenzando con "Más Útil" y termina con "Menos Útiles":

7 de 7
21 de 26
9 de 10
6 de 6
8 de 9
5 de 5
7 de 8
12 de 15

¿Qué ecuación necesito usar para el cálculo de este criterio de ordenación correctamente? Pensé que tenía un par de veces, pero el "7 de 7" y "6 de 6" y "5 de 5" siempre me tiran fuera. Lo que me estoy perdiendo?

10voto

Robert Höglund Puntos 5572

David Eppstein sugiere un método Bayesiano en su comentario. Una cosa estándar para hacer en esta situación es el uso de un uniforme antes. Es decir, antes de las evaluaciones de una revisión venir, su probabilidad de $p_i$ de ser útil se supone que para ser distribuidos de manera uniforme en [0, 1]. Tras la recepción de cada evaluación de la revisión, aplicar el teorema de Bayes.

Esto suena complicado, y sería para una arbitraria antes de la distribución. Pero resulta que con el uniforme de la anterior, la posterior distribución en todas las distribuciones beta. En particular, se espera que el valor de $p_i$ después de la s evaluaciones positivas y n-s negativos (s+1)/(n+2). Esto es de Laplace de la regla de la sucesión, y las pruebas de los hechos que he mencionado puede encontrarse en que artículo de la Wikipedia. Entonces el tipo del resultado (s+1)/(n+2).

Las constantes "1" y "2" provienen de la utilización de un uniforme de antes, y en realidad no dan los mismos resultados que la muestra de datos que usted proporcione. Pero si dar una opinión que s de n personas han dicho que para ser útil a la puntuación (s+3)/(n+6), entonces tus comentarios tienen puntuaciones

7 de 7: 10/13 = 0.769...

21 de 26: 24/32 = 0.75

9 de las 10: 12/16 = 0.75

6 de 6: 9/12 = 0.75

8 de 9: 11/15 = 0.733

5 de 5: 8/11 = 0.727

7 de 8: 10/14 = 0.714

12 de 15: 15/21 = 0.714

Esto, en esencia, las cantidades a ordenar por la proporción de evaluaciones positivas de cada examen, excepto que cada revisión se inicia con algunos "imaginario" de las evaluaciones, tres positivos y tres negativos. (No estoy diciendo que (3,6) es el único par de constantes que se reproducen en el orden que se le da; sólo son la primera pareja que he encontrado, y de hecho (3k, 4k+2) funciona para cualquier $k \ge 1$.)

7voto

sickgemini Puntos 2001

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X