¿Cuál es la diferencia entre episodio y época en el aprendizaje Q profundo?

Question

¿Cuál es la diferencia entre episodio y época en el aprendizaje Q profundo?

Preguntado el 11 de Diciembre, 2016: Cuando se hizo la pregunta
26394 visitas: Cuantas visitas ha tenido la pregunta
1 Respuestas: Cuantas respuestas ha tenido la pregunta
Resuelta: Estado actual de la pregunta

Estoy intentando entender el famoso paper "Playing Atari with Deep Reinforcement Learning" ( pdf ). No tengo clara la diferencia entre un época y episodio . En algoritmo $1$ el bucle exterior ha terminado episodios mientras que en la figura $2$ el eje x está etiquetado época . En el contexto del aprendizaje por refuerzo, no tengo claro qué significa una época. ¿Es una época un bucle exterior alrededor del bucle del episodio?

Preguntado el 11 de Diciembre, 2016 por Gerry Coll

Answer 1

1 Respuestas

Answer 2

31voto

Franck Dernoncourt Puntos 2128

un episodio \= una secuencia de estados, acciones y recompensas, que termina con el estado terminal. Por ejemplo, jugar una partida entera puede considerarse como un episodio, alcanzándose el estado terminal cuando un jugador pierde/gana/empata. A veces, se prefiere definir un episodio como varias partidas ( ejemplo : "cada episodio son unas decenas de partidas, porque las partidas llegan hasta la puntuación de 21 para cualquiera de los dos jugadores").
un época \= una pasada hacia delante y otra hacia atrás de todos los ejemplos de entrenamiento, en la terminología de las redes neuronales.

En el artículo que mencionas, parecen ser más flexibles con respecto al significado de época, ya que sólo definen una época como una cierta cantidad de actualizaciones de peso. Por lo tanto, se puede considerar que una época es un bucle exterior alrededor del bucle del episodio, como mencionas en la pregunta.

Respondido el 11 de Diciembre, 2016 por Franck Dernoncourt (2128 Puntos )

¿Cuál es la diferencia entre episodio y época en el aprendizaje Q profundo?

Respuesta

Preguntas Destacadas

Etiquetas mas usadas

i-Ciencias.com

Powered by:

¿Cuál es la diferencia entre episodio y época en el aprendizaje Q profundo?

Respuesta

Preguntas relacionadas

Preguntas Destacadas

Etiquetas mas usadas

En nuestra red

i-Ciencias.com

Powered by: