Decidir entre transformadores de sólo decodificador o de sólo codificador (BERT, GPT)

Question

Decidir entre transformadores de sólo decodificador o de sólo codificador (BERT, GPT)

Preguntado el 23 de Marzo, 2021: Cuando se hizo la pregunta
307 visitas: Cuantas visitas ha tenido la pregunta
1 Respuestas: Cuantas respuestas ha tenido la pregunta
Resuelta: Estado actual de la pregunta

Acabo de empezar a aprender sobre los transformadores y he investigado las siguientes 3 variantes

El original de La atención es todo lo que necesitas (Codificador y decodificador)
BERT (Sólo codificador)
GPT-2 (Sólo decodificador)

¿Cómo se decide en general si su modelo de transformador debe incluir sólo codificadores, sólo descodificadores, o ambos codificadores y descodificadores?

Por ejemplo, si quiero entrenar a un transformador para que lea una secuencia de imágenes de mi patio trasero y luego prediga si lloverá en una hora (2 clases "llover" o "no llover"), ¿este modelo de transformador debe tener generalmente sólo decodificadores?

Preguntado el 23 de Marzo, 2021 por foryou

Answer 1

1 Respuestas

Answer 2

3voto

kainlite Puntos 361

El BERT sólo necesita la parte del codificador del Transformer, esto es cierto pero el concepto de enmascaramiento es diferente al del Transformer. Usted enmascara una sola palabra (token). Así que le proporcionará la manera de revisar la ortografía de su texto, por ejemplo, prediciendo si el palabra es más relevante que el wrd en la siguiente frase.

My next <mask> will be different.

El GPT-2 es muy similar al transformador sólo para decodificadores que es cierto de nuevo, pero de nuevo no del todo. Yo diría que estos son modelos relacionados con el texto, pero ya que usted mencionó imágenes recuerdo que alguien me dijo BERT es conceptualmente VAE.

Así que puede utilizar BERT como modelos y que tendrán la $h$ estado que puede utilizar para decir sobre el tiempo.

Utilizaría el GPT-2 o modelos similares para predecir nuevas imágenes basado en algunos píxeles de inicio.

Sin embargo, para lo que necesitas necesitas tanto el transformador de codificación como el de decodificación, porque te gustaría codificar el fondo al estado latente y luego decodificarlo a la lluvia de texto.

Estas redes existen y pueden anotar las imágenes. Pero no se necesita un transformador, sólo un simple texto e imagen VAE puede funcionar.

Respondido el 23 de Marzo, 2021 por kainlite (361 Puntos )

Decidir entre transformadores de sólo decodificador o de sólo codificador (BERT, GPT)

Respuesta

Preguntas Destacadas

Etiquetas mas usadas

i-Ciencias.com

Powered by:

Decidir entre transformadores de sólo decodificador o de sólo codificador (BERT, GPT)

Respuesta

Preguntas relacionadas

Preguntas Destacadas

Etiquetas mas usadas

En nuestra red

i-Ciencias.com

Powered by: