Estoy trabajando en un proyecto en el que intento tomar un par de documentos y encontrar y agrupar (cluster) palabras y frases similares entre ellos.
¿Qué algoritmo podría resolver este tipo de problema? Sé que es una pregunta muy mundana y probablemente subjetiva, pero soy nuevo en el tema de la agrupación y todavía estoy tratando de abrirme camino en el vocabulario.
Se agradecerá su ayuda.