5 votos

Búsqueda de artículos similares en función de los gustos del usuario

Tengo datos sobre recomendaciones de películas basadas en el contenido y sus atributos.

Supongamos que a un usuario le gustan las películas x,y y z y que además no le gustan las películas c y d. Quiero predecir las películas que le gustarán en función de sus gustos y aversiones.

En realidad es bastante fácil encontrar elementos similares si la única interacción fuera una película como, porque entonces estaría buscando los elementos más cercanos a x película calculando las distancias a través de los atributos. Pero es bastante confuso cuando las interacciones son múltiples y se basan en gustos y disgustos.

¿Cuál es el enfoque correcto en ese caso?

2voto

Aayush Puntos 6

Dada una película objetivo 't', que queremos considerar para la recomendación, un enfoque sencillo sería encontrar primero la película 's' más cercana en el conjunto de calificaciones de los usuarios (me gusta + no me gusta). Si "s" es una película que le gusta al usuario, entonces recomendamos "t", si no, no.

Otro enfoque consiste en utilizar el conjunto de gustos y disgustos de un usuario para "votar" la película objetivo. En primer lugar, se calculan las similitudes, si es posible (basadas en la medida de distancia), entre t y cada película s del conjunto calificado. A continuación, la "puntuación" de t se calcula sumando las similitudes con todas las películas que "gustan" y restando las similitudes con todas las películas que "no gustan". Si la puntuación es positiva, la película se recomienda, si no, no. Si el conjunto calificado es grande, se puede utilizar un número fijo de vecinos cercanos para la votación.

Ver https://en.wikipedia.org/wiki/K-nearest_neighbors_algorithm

0voto

Jon Seigel Puntos 384

La naturaleza binaria de las variables hace que esto parezca un caso ideal para un árbol de decisión. Echa un vistazo a los bosques aleatorios.

1 votos

Los RF son una bolsa de árboles de decisión. El hecho de que la variable de respuesta sea binaria cuando se utilizan las RF es irrelevante en este caso, OMI.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X