¿Se ha reproducido el rendimiento de vanguardia del uso de vectores de párrafos para el análisis de sentimientos?

Question

¿Se ha reproducido el rendimiento de vanguardia del uso de vectores de párrafos para el análisis de sentimientos?

Preguntado el 11 de Noviembre, 2014: Cuando se hizo la pregunta
3930 visitas: Cuantas visitas ha tenido la pregunta
1 Respuestas: Cuantas respuestas ha tenido la pregunta
Resuelta: Estado actual de la pregunta

Me impresionaron los resultados de la ponencia del ICML 2014 " Representaciones distribuidas de frases y documentos "de Le y Mikolov. La técnica que describen, denominada "vectores de párrafo", aprende representaciones no supervisadas de párrafos/documentos arbitrariamente largos, basándose en una extensión del modelo word2vec. El artículo presenta los resultados más avanzados del análisis de sentimientos con esta técnica.

Esperaba evaluar esta técnica en otros problemas de clasificación de textos, como alternativa a la representación tradicional de bolsa de palabras. Sin embargo, me encontré con un post del segundo autor en un hilo del grupo de Google de word2vec que me hizo reflexionar:

Yo mismo intenté reproducir los resultados de Quoc durante el verano; pude obtener tasas de error en el conjunto de datos IMDB de entre el 9,4% y el 10% (dependiendo de la calidad de la normalización del texto). la normalización del texto). Sin embargo, no pude acercarme Quoc en su artículo (7,4% de error, una diferencia enorme)... diferencia) ... Por supuesto, también le preguntamos a Quoc por el código. prometió publicarlo, pero hasta ahora no ha sucedido nada ... Estoy empezando a pensar que los resultados de Quoc no son reproducibles.

¿Alguien ha conseguido reproducir estos resultados?

Preguntado el 11 de Noviembre, 2014 por Gilles Bonnet

Answer 1

1 Respuestas

Answer 2

17voto

kittachami Puntos 31

Nota a pie de página http://arxiv.org/abs/1412.5335 (uno de los autores es Tomas Mikolov) dice

En nuestros experimentos, para igualar los resultados de (Le & Mikolov, 2014), seguimos la sugerencia de Quoc Le de utilizar softmax jerárquico en lugar de muestreo negativo. Sin embargo, esto produce el resultado de precisión del 92,6% solo cuando los datos de entrenamiento y de prueba no se barajan. Por lo tanto, consideramos que este resultado no es válido.

Respondido el 6 de Julio, 2016 por kittachami (31 Puntos )

¿Se ha reproducido el rendimiento de vanguardia del uso de vectores de párrafos para el análisis de sentimientos?

Respuesta

Preguntas Destacadas

Etiquetas mas usadas

i-Ciencias.com

Powered by:

¿Se ha reproducido el rendimiento de vanguardia del uso de vectores de párrafos para el análisis de sentimientos?

Respuesta

Preguntas relacionadas

Preguntas Destacadas

Etiquetas mas usadas

En nuestra red

i-Ciencias.com

Powered by: