Estoy de computación coseno similitudes entre 2 vectores.
Estos son vectores de recuperación de información, la consulta y el documento representaciones respectivamente.
Ellos han sido calculadas usando tf-idf pesos.
Desde mis documentos tienen diferente longitud, tf-idf pesos son teóricamente ilimitado.
La pregunta es: es la similitud del coseno todavía una medida válida? Puedo comparar varios coseno similitudes para cada doc?