Scott MacDougall es un usuario de Stack Exchange, si haces click en el enlace verás su perfil en inglés.
Últimas Preguntas
-
Todavía no ha hecho preguntas
Últimas Respuestas
- 30 votos
¿Cuándo se prefieren los métodos de Monte Carlo sobre los de diferencia temporal?
el 27 de Marzo, 2018 30 votos - 3 votos
¿Estas dos ecuaciones de Bellman expresan la misma idea?
el 28 de Agosto, 2019 3 votos - 9 votos
¿Qué son las políticas blandas en el aprendizaje por refuerzo?
el 24 de Abril, 2018 9 votos - 6 votos
Diagrama de iteración de políticas en Jack's Car Rental (en aprendizaje por refuerzo)
el 17 de Octubre, 2017 6 votos - 9 votos
El valor de un estado terminal en el aprendizaje por refuerzo
el 28 de Agosto, 2017 9 votos - 12 votos
Aprendizaje por refuerzo en un entorno no estacionario
el 19 de Octubre, 2017 12 votos - 5 votos
¿El aprendizaje de refuerzo es la opción correcta para pintar como Bob Ross?
el 31 de Agosto, 2018 5 votos
Etiquetas favoritas
- 8 x estadística
- 6 x reinforcement-learning
- 1 x regresión
- 1 x redes-de-neuronas
- 1 x python
- 1 x keras
- 1 x los-sistemas-de-refuerzo-de-aprendizaje