3 votos

¿Por qué la atención de Bahdanau se llama a veces atención concat?

Estoy aprendiendo la intuición detrás del mecanismo de atención de

y hay algo que no entiendo bien. Ambas entradas hacen referencia a alguna concatenación que ocurre en la etapa de decodificación. De la lectura del documento de Bahdanau, en ninguna parte se dice que la puntuación de la alineación se basa en la concatenación del estado del decodificador ( si ) y el estado oculto ( ht ). En Documento de Luong se conoce como el concat atención (la palabra puntuación se utiliza, sin embargo)

score(ht;h¯s)=vaTtanh(Wa[ht;h¯s])

o en la notación de Bahdanau:

a(si1,hj)=vaTtanh(Wa[si1;hj])

En Documento de Bahdanau la puntuación de la alineación se define como

a(si1,hj)=vaTtanh(Wasi1+Uahj)

Y la única concatenación que se produce es la de los estados ocultos hacia delante y hacia atrás en el codificador bidireccional. Parece que la definición de atención aditiva de Vaswani tiene más sentido.

¿De dónde viene esta idea de la concatenación?


Posiblemente relacionado

4voto

aldorado Puntos 155

El operador de punto y coma en las fórmulas denota en realidad la concatenación y la concatenación a la que se refieren en el documento (en contraposición al producto punto).

La suma en la formulación de Bahdanau con la suma de dos proyecciones es equivalente a una proyección de la concatenación de vectores ( denota concatenación):

Wasij+Uahj=(WaUa)(si1hj)

Se deduce directamente de la definición de multiplicación de matrices. Llamemos a la dimensión de la proyección intermedia, ds dimensión del estado del decodificador, dh dimensión del estado del codificador. Entonces, para el k -ésima posición en la salida:

[(WaUa)(si1hj)]k=l=1ds+dh(WaUa)k,l(si1hj)l=l=1ds(Wa)k,l(si1)l+l=1dh(Ua)k,l(hl)l=[Wasi1]k+[Uahj]k

Así que, en la notación de Luong, WaWaUa en la notación de Bahdanau.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X