Consideremos el problema del filtrado colaborativo. Tenemos la matriz $M$ de tamaño #usuarios * #artículos. $M_{i,j} = 1$ si al usuario i le gusta el artículo j, $M_{i,j} = 0$ si al usuario i no le gusta el artículo j y $M_{i,j}=?$ si no hay datos sobre el par (i,j). Queremos predecir $M_{i,j}$ para futuros usuarios, pares de artículos.
El enfoque estándar de filtrado colaborativo consiste en representar M como producto de 2 matrices $U \times V$ tal que $||M - U \times V||_2$ es mínimo (por ejemplo, minimizando el error cuadrático medio para elementos conocidos de $M$ ).
A mí me parece que la función de pérdida logística es más adecuada, ¿por qué todos los algoritmos utilizan el MSE?
1 votos
En este caso tiene sentido pero la mayoría de las veces M_i,j puede ser una calificación y en ese caso el MSE es más útil. Yo diría que el MSE es más general.