24 votos

¿Se ha reproducido el rendimiento de vanguardia del uso de vectores de párrafos para el análisis de sentimientos?

Me impresionaron los resultados de la ponencia del ICML 2014 " Representaciones distribuidas de frases y documentos "de Le y Mikolov. La técnica que describen, denominada "vectores de párrafo", aprende representaciones no supervisadas de párrafos/documentos arbitrariamente largos, basándose en una extensión del modelo word2vec. El artículo presenta los resultados más avanzados del análisis de sentimientos con esta técnica.

Esperaba evaluar esta técnica en otros problemas de clasificación de textos, como alternativa a la representación tradicional de bolsa de palabras. Sin embargo, me encontré con un post del segundo autor en un hilo del grupo de Google de word2vec que me hizo reflexionar:

Yo mismo intenté reproducir los resultados de Quoc durante el verano; pude obtener tasas de error en el conjunto de datos IMDB de entre el 9,4% y el 10% (dependiendo de la calidad de la normalización del texto). la normalización del texto). Sin embargo, no pude acercarme Quoc en su artículo (7,4% de error, una diferencia enorme)... diferencia) ... Por supuesto, también le preguntamos a Quoc por el código. prometió publicarlo, pero hasta ahora no ha sucedido nada ... Estoy empezando a pensar que los resultados de Quoc no son reproducibles.

¿Alguien ha conseguido reproducir estos resultados?

17voto

kittachami Puntos 31

Nota a pie de página http://arxiv.org/abs/1412.5335 (uno de los autores es Tomas Mikolov) dice

En nuestros experimentos, para igualar los resultados de (Le & Mikolov, 2014), seguimos la sugerencia de Quoc Le de utilizar softmax jerárquico en lugar de muestreo negativo. Sin embargo, esto produce el resultado de precisión del 92,6% solo cuando los datos de entrenamiento y de prueba no se barajan. Por lo tanto, consideramos que este resultado no es válido.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X