Estoy tratando de escribir mi propio sistema de recomendación. He conjunto de datos de usuario-objeto de calificación de la matriz. Pero no tengo perfil de información acerca de cualquiera de los elementos o de los usuarios. Ya he construido CF puro mediante el coseno y Pearson. Estoy tratando de construir un sistema de recomendación de usar el bosque aleatorio. He leído un poco de papel, pero esos son los bosque aleatorio en el modelo basado en los sistemas de recomendación. Su ayuda sería muy apreciada.
Respuestas
¿Demasiados anuncios?Como calcular la similitud del coseno Bosques Aleatorios puede ser utilizado para la supervisión de aprendizaje. Estos sin supervisión Aleatoria de los Bosques de salida de matrices de similitud basado en la proximidad. La única salvedad es que el Bosque Aleatorio similitud se basa en el conjunto de los datos, es decir, no pares calculado, debe darle el conjunto de los datos para que aprenda la similitud, ya que está basado en el número de veces que dos observaciones dadas terminó en la misma hoja en los árboles. En otras palabras, esto significa que usted tendría que volver a calcular toda la matriz de proximidades de todos los datos cada vez que una nueva observación se agrega.
Para leer acerca de la supervisión Aleatoria de los Bosques, recomiendo esta pequeña descripción de Leo, Breiman y Adele Cutler sitio (los inventores de Bosques Aleatorios).
Incluso wikipedia incluye una sección sobre supervisión de aprendizaje con bosques aleatorios.
RF puede ser utilizado para la memoria de recomendación basados en el sistema.
La memoria de los métodos basados en el uso de las métricas de similitud(1). Las métricas de similitud (por ejemplo, similitud del coseno) no son vigiladas y se acaba de ejecutar una regla definida por el usuario.
RF no es una métrica de similitud. Se trata de un aprendizaje supervisado modelo.
(1) https://en.wikipedia.org/wiki/Collaborative_filtering#Memory-based