Sé que en los sistemas de recomendación se tiene una matriz de valoración y luego se factoriza esta matriz en dos matrices y luego se aprenden esas matrices con el descenso de gradiente. En esas matrices especificamos el número de dimensiones/características latentes que queremos. Así que una de ellas será de tamaño number_of_users∗k_latent_features . Mi pregunta es por qué elegimos el parámetro K (número de características latentes) sea menor que el número de usuarios o artículos? No consigo entender la suposición de que el número de características latentes debe ser bajo.
¿qué quiere decir con características "recurrentes"?
0 votos
Después de La navaja de Occam intentamos explicar lo que vemos con un modelo sencillo (por ejemplo, pocas características latentes).