Hace poco me inicié en los sistemas de recomendación y estuve estudiando el filtrado colaborativo basado en el usuario (UB-CF).
En alguna parte del texto, se especifica que la similitud coseno es una de las medidas para encontrar usuarios similares y luego dar una recomendación.
por ejemplo, un modelo de recomendación de películas:
Para empezar, creamos una matriz de usuarios y películas con las valoraciones que han proporcionado.
movie1 movie2 movie3
User1 5 5 5
User2 1 1 1
En este caso, la similitud coseno será 1 mientras que ambos usuarios han dado una opinión muy diferente de la película y no son similares. ¿Cómo trata la similitud del coseno este tipo de problemas? ¿No induce a error?
PD: Entiendo que el caso es demasiado hipotético desde el punto de vista de un sistema de recomendación en el que he considerado sólo 3 películas y ambos usuarios las han visto, mientras que en la realidad la matriz sería muy escasa.