1 votos

El valor más alto de las métricas de traducción automática

¿Alguien conoce los valores más altos y más bajos de las métricas comunes de traducción automática? $BLEU_{1-4}$ , $METEOR$ , $ROUGE_{L}$ y $CIDEr$ y $CIDEr-D$ ?

Sé que para BLEU es 1, ¿correcto? ¿Es lo mismo para todas las demás métricas mencionadas anteriormente?

Además, ¿qué pasa con $CIDEr$ y $CIDEr-D$ métrica? ¿Cuál es el valor máximo?

1voto

Franck Dernoncourt Puntos 2128
  • $BLEU_{1-n}$ : mínimo 0, máximo 1.
  • $METEOR$ : mínimo 0, máximo 1.
  • $ROUGE_{n}$ , $ROUGE_{L}$ , $ROUGE_{S}$ : mínimo 0, máximo 1.
  • $CIDEr$ : mínimo 0, máximo 1. Referencia original: {1}.
  • $CIDEr-D$ ?: mínimo 0, máximo 1. $CIDEr-D$ = CIDEr Defended, llamado así por ser más robusto a los efectos del juego. Referencia original: {1}.

Ten en cuenta que a veces la gente utiliza el porcentaje. Por ejemplo, se podría decir $ROUGE_{n}=40\%$ .

{2} repasa todas estas métricas en el contexto de la evaluación del subtitulado de imágenes. Nótese que para ROUGE hay algunas pequeñas diferencias entre la forma en que {2} (y muchos otros artículos) presentan ROUGE y la implementación original de ROUGE (por ejemplo, tiene stemming).


Referencias:

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X