Sé que en los sistemas de recomendación se tiene una matriz de valoración y luego se factoriza esta matriz en dos matrices y luego se aprenden esas matrices con el descenso de gradiente. En esas matrices especificamos el número de dimensiones/características latentes que queremos. Así que una de ellas será de tamaño $number\_of\_users * k\_latent\_features$ . Mi pregunta es por qué elegimos el parámetro $K$ (número de características latentes) sea menor que el número de usuarios o artículos? No consigo entender la suposición de que el número de características latentes debe ser bajo.
¿qué quiere decir con características "recurrentes"?
0 votos
Después de La navaja de Occam intentamos explicar lo que vemos con un modelo sencillo (por ejemplo, pocas características latentes).