Dennis Soemers es un usuario de Stack Exchange, si haces click en el enlace verás su perfil en inglés.
Últimas Preguntas
-
Todavía no ha hecho preguntas
Últimas Respuestas
- 34 votos
- 3 votos
La propiedad de Markov en la práctica RL
el 17 de Febrero, 2018 3 votos - 7 votos
Q-Learning: estado independiente de la acción del agente
el 17 de Mayo, 2018 7 votos - 3 votos
SARSA regla de actualización de
el 2 de Enero, 2018 3 votos - 10 votos
¿Aprendizaje Q cuándo dejar de entrenar?
el 17 de Enero, 2018 10 votos - 25 votos
Por qué $P(A|B) \neq P(A | B,C) + P(A | B, \neg C)$?
el 19 de Marzo, 2018 25 votos
Etiquetas favoritas
- 6 x estadística
- 3 x q-learning
- 2 x de-aprendizaje-de-la-máquina
- 2 x los-sistemas-de-refuerzo-de-aprendizaje
- 2 x reinforcement-learning
- 1 x probabilidad
- 1 x bayesiano