¿Cuál es un modelo de aprendizaje automático adecuado para un juego de dados?

Question

¿Cuál es un modelo de aprendizaje automático adecuado para un juego de dados?

Preguntado el 6 de Octubre, 2015: Cuando se hizo la pregunta
2245 visitas: Cuantas visitas ha tenido la pregunta
1 Respuestas: Cuantas respuestas ha tenido la pregunta
Resuelta: Estado actual de la pregunta

Me cuesta pensar en la forma correcta de plantear el siguiente problema: digamos que un juego de dados (como Yahtzee) consiste en lanzar hasta 5 dados de 6 caras en tres rondas. Después de las tres rondas, se otorga una puntuación basada en el patrón al que se ajusta el dado. En la primera ronda, se lanzan los cinco dados. En las rondas siguientes, se pueden retener algunos dados y lanzar el resto en un esfuerzo por confirmar un patrón de puntuación más alto. (Por ejemplo, sacas 3 dados iguales y ahora quieres tirar los dos restantes para obtener 4 o 5 iguales).

Me gustaría crear un modelo de aprendizaje automático (por diversión) para entrenar y determinar qué dados retener y qué dados tirar en una ronda determinada para mejorar el patrón. Como variables de entrada, se da el estado S (1-6) de cada uno de los cinco dados, una decisión D de tirar o no construida de (0 o 1) para cada uno de los cinco dados (codificado binario de 0-31), y puedo generar un conjunto de entrenamiento que comprenda la información anterior más los resultados simulados R. Así que en resumen, cada observación en el conjunto de entrenamiento contendrá un vector de valores iniciales de los dados S, una máscara de bits de qué dados tirar D, un vector simulado de valores finales de los dados R, y +1 si esto mejoró el patrón y -1 si no mejoró.

¿Cuál es la mejor manera de plantear este problema? Si estoy prediciendo D, parece que el modelo debería ser D~S, pero esto ignora R. Si incluyo R, y entreno en D~S+R, ¿cómo puedo predecir los resultados sabiendo sólo D?

Preguntado el 6 de Octubre, 2015 por michaelb

Answer 1

1 Respuestas

Answer 2

4voto

michaelb Puntos 16

Después de investigar diferentes enfoques de aprendizaje automático, creo que el aprendizaje reforzado y los Procesos de Decisión de Markov son apropiados para aplicarlos a la toma de decisiones en un juego de dados como el Yahtzee. Anteriormente sólo había estado expuesto al aprendizaje supervisado y no supervisado.

He escrito mi enfoque aquí ( http://rpubs.com/ggraham412/117575 ) y he creado una implementación de juguete en Python aquí ( https://github.com/ggraham-412/RLDiceGame ).

Respondido el 15 de Octubre, 2015 por michaelb (16 Puntos )

¿Cuál es un modelo de aprendizaje automático adecuado para un juego de dados?

Respuesta

Preguntas Destacadas

Etiquetas mas usadas

i-Ciencias.com

Powered by:

¿Cuál es un modelo de aprendizaje automático adecuado para un juego de dados?

Respuesta

Preguntas relacionadas

Preguntas Destacadas

Etiquetas mas usadas

En nuestra red

i-Ciencias.com

Powered by: