Soy bastante nuevo en ML, así que lo siento si esta pregunta ha sido respondida antes.
Conjunto de datos de:
- usuarios (100.000 únicos)
- películas (7000 únicas) con datos de género (acción, comedia) y resumen del argumento
- para cada usuario, una lista de sus valoraciones de películas (20 millones de registros en total)
El objetivo es crear un modelo que, al proporcionar la lista de valoraciones de películas de un usuario, pueda recomendarle películas que pueda disfrutar.
Estaba pensando que podría segmentar mis datos de usuarios existentes en "grupos" basados en patrones de visualización, y luego colocar a mi nuevo usuario en uno de ellos, y hacer recomendaciones a partir de lo que le gusta al grupo. También podría buscar películas con etiquetas de género similares a las que le gustan al usuario.
¿Qué tipo de modelo sería el más adecuado para esto? ¿O recomendaría abordar este problema desde una perspectiva/metodología diferente?
Mis limitados conocimientos de ML me dicen que esto requiere un proceso no supervisado, algo así como un algoritmo de k-clustering.
Gracias de antemano.