6 votos

¿Cómo determinar un usuario ' productor favorito de contenido s de calificaciones individuales?

Considere el siguiente escenario:

Alice se suscribe a un servicio de alquiler de vídeo servicio que le permite ver películas. Cada vez que ve una película, ella tasas de cualquiera de los pulgares para arriba (1) o hacia abajo (0), y luego elige la siguiente película que quiere ver. Cada película pertenece exactamente a un director y un director puede tener dirigido muchas películas. La pregunta es, ¿cuál es la mejor manera de determinar que Un "favorito" director es?

Mi idea inicial era hacer algo como:

  • Para cada director de, al menos, una película que vieron, calcular el límite inferior de algunos binomio intervalo de confianza (por ejemplo, Wilson puntuación de intervalo) como la "favorabilidad" puntuación para que el director

Sin embargo, este binomio enfoque parece erróneo porque ignora aparentemente pieza crucial de información: Alice tiene todo un universo de películas para elegir, y si siempre se elige a ver películas a partir de un determinado director, entonces no se que nos dicen algo acerca de su preferencia por que el director, incluso si ella entonces las tasas que el director de películas por debajo de su promedio? Siento que debe haber algún elemento de "votar con los pies" se ignora si solo tenemos en cuenta las calificaciones de las películas que fueron vistos.

¿Cuál es la mejor forma de combinar tanto la selección de la película/director con las calificaciones de las películas individuales para determinar quién es Un favorito del director? Parece Una preferencia por el director D tiene que ser una función de la calificación de D las películas que vio, y también el % de D las películas que elegí para ver.

ACTUALIZACIÓN: te aclaro, el problema que estoy tratando no es tan simple como el pulgar hacia arriba y los pulgares hacia abajo caso, es realmente más como "Una ve una película y, a continuación, comprueba si le había gustado." Así que cada visionado da como resultado un 0 o un 1, pero la ausencia de comprobación de un cuadro no es exactamente la misma cosa como un "pulgar hacia abajo" debido a que el espectador sólo puede sentirse obligado a comprobar la "aprobar" si ella realmente le gusta algo. Toda la razón más que en la elección de qué reloj tiene un factor en las preferencias

1voto

Matthew Cole Puntos 697

Su pregunta indica que desea una puntuación que da algo de peso tanto de ver una película (si el usuario le gusta o no) y algunos más peso a gusto. Me gustaría empezar por definir $M_{ud}$ como el máximo posible número de películas por director de la $d$ visto por el usuario $u$ como proporción de todas las películas que se vieron por $u$:

$M_{ud} = Min(N_d/W_u, 1)$

donde $N_d$ es el número total de películas realizadas por $d$ $W_u$ es el número total de películas vigilado por $u$. (El$Min$, debido a la proporción que lógicamente no puede exceder de 1). A continuación, $W_{ud} / W_u$ es el actual número de películas por $d$ visto por $u$ como proporción de todas las películas que se vieron por $u$, y

$s_w = \frac{W_{ud}}{W_uM_{ud}}$

es una posible medida de la cantidad de $u$ le gusta $d$. Pero porque también tenemos información sobre los "me gusta", tenemos una segunda medida posible

$s_l = \frac{L_{ud}}{W_uM_{ud}}$

donde $L_{ud}$ es el número de películas por $d$ le gustó por $u$. Por último, se puede combinar $s_w$ $s_l$ en una sola puntuación, por ejemplo:

$s = (1 - b)s_w + bs_l$

donde b es un número que elija entre 0 y 1 para reflejar la importancia relativa de gusto una película en lugar de sólo verla.

Cabe destacar que la exacta formas funcionales utilizadas son arbitrarias y se debe jugar con ellos (y el de ponderación a, b) hasta que obtenga los resultados que tengan sentido para usted. Por ejemplo, elevar las dos puntuaciones a una potencia mayor que 1 puede ser útil como se asignará un peso inferior a los primeros 1 o 2 películas visto/gustado y más peso a los 6 o el 7.

1voto

Neal Puntos 316

Realmente una respuesta simple es el modal director, pero que no se ajusta a la composición, ya que algunos directores pueden ser más prolífico o simplemente mayor.

Para cada usuario, me volvería a considerar la relación de gustado las películas de la directora $i$ a todas las películas observado por el director de la $i$, escala por la relación de todas las películas que se observa para todas las películas realizadas por el director de la $i$. Cuando un usuario no ha visto ninguna de las películas dirigidas por $i$, esta proporción es indefinido, y se puede restablecer a cero. El director con el valor más alto de esta cantidad es el favorito. Tengo la intuición geométrica para esta fórmula a partir de un diagrama de Venn. Creo que de esta forma se controla por el tamaño de cada director del corpus y está acotada entre 0 y 1.

Aquí están algunos ejemplos con números. Alice ha gustado 5 películas de Herzog de las 10 que ha hecho y todo lo que ella ha visto. Ella ha visto 20 películas en total. El Herzog puntuación es $\frac{5}{10}/{\frac{20}{10}}=0.25$. Supongamos que ella sólo ha visto siete Herzogs. La puntuación salta a $\frac{5}{7}/{\frac{20}{10}}=0.35$.

Las personas también tienden a ver las películas en grupos, y así se ven las películas que no les gusta. Esto necesita ser explicada. Supongamos que Alicia sólo ha visto Herzog con el humor de su esposo Bob y a ella le gustaba ninguno de ellos. La puntuación es ahora $\frac{0}{10}/{\frac{20}{10}}=0$. Para mí, esta es la sensible interpretación de observación y desagrado. No depende de cuántos Herzogs ella ha visto.

Este enfoque no se menciona explícitamente el uso de la secuencia de películas. Es probable que importa si ella miró a todos a la vía verde de las películas antes de que todos los Herzogs. Por otro lado, las personas desarrollan gustos a lo largo del tiempo, así que tal vez el orden es menos interesante, aunque tal vez usted puede utilizar el tiempo para romper lazos. Asimismo, no se hace uso de la "clumpiness". Si ella observaba cada Herzog en una fila después de ver la primera, que es una fuerte señal de que le gusta su trabajo, con respecto a si estaban todos dispersos a lo largo de su historial de visualización. Tal vez usted puede cambiar la escala de puntuación de arriba por una medida de la entropía, pero no sé lo suficiente acerca de esto realmente ayuda.

0voto

Yo creo que algún tipo de sistema de recomendación puede ser lo que buscas.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X