Mi problema: Los datos de entrada son un corpus de documentos cortos (unas pocas frases cada uno). En cada documento hay que clasificar algunas expresiones en categorías. Un documento debe contener algunas categorías (cada expresión tiene una sola etiqueta), y el resto son opcionales. La tarea: dada una expresión y las palabras que la rodean, clasificar su categoría.
Como solución pensé en convertir las palabras de mi vocabulario en vectores usando word2vec, y luego aplicar algún clasificador multiclase.
¿Hay algún clasificador que se ajuste especialmente bien a la salida de word2vec? He pensado en usar svm, ¿hay algún núcleo recomendado?