Desde un punto de vista práctico...
El LDA comienza con una bolsa de palabras de entrada que tiene en cuenta las palabras que coinciden en los documentos, pero no presta atención al contexto inmediato de las palabras. Esto significa que las palabras pueden aparecer en cualquier lugar del documento y en cualquier orden, lo que elimina cierto nivel de información. En cambio, word2vec tiene en cuenta el contexto en el que se utiliza una palabra, aunque quizá no el orden exacto.
Los "temas" de LDA son una construcción matemática y no debes confundirlos con temas humanos reales. Puedes acabar con temas que no tienen interpretación humana -son más bien artefactos del proceso que temas reales- y puedes acabar con temas en diferentes niveles de abstracción, incluyendo temas que básicamente cubren el mismo tema humano. Es un poco como leer las hojas de té.
He encontrado el LDA útil para explorar los datos, pero no tan útil para proporcionar una solución, pero su kilometraje puede variar.
Word2vec no crea temas directamente en absoluto. Proyecta palabras en un espacio de alta dimensión basado en un uso similar, por lo que puede tener sus propias sorpresas en cuanto a que palabras que usted considera distintas -o incluso opuestas- pueden estar cerca unas de otras en el espacio.
Puede utilizar cualquiera de los dos métodos para determinar si las palabras son "similares". Con LDA: ¿tienen las palabras pesos similares en los mismos temas? Con word2vec: ¿están cerca (por alguna medida) en el espacio de incrustación?
Puede utilizar cualquiera de ellos para determinar si los documentos son similares. Con LDA, se buscaría una mezcla similar de temas, y con word2vec se haría algo como sumar los vectores de las palabras del documento. ("Documento" puede ser una frase, un párrafo, una página o un documento entero.) Doc2vec es una versión modificada de word2vec que permite la comparación directa de documentos.
Aunque LDA desecha parte de la información contextual con su enfoque de bolsa de palabras, tiene temas (o "tópicos"), que word2vec no tiene. Así que es sencillo usar doc2vec para decir: "Muéstrame documentos que son similares a este", mientras que con LDA es sencillo decir: "Muéstrame documentos donde el tema A es prominente". (De nuevo, sabiendo que el "tema A" emerge de un proceso matemático en tus documentos y entonces averiguas a qué tema(s) humano(s) corresponde mayoritariamente).