Considere el siguiente de un solo jugador del juego: en un principio, no hay una olla de $\$0$. On each turn, the player may opt to end the game and collect the contents of the pot, or roll a single die. In the latter case, if the roll is $1$, the game is over and the player collects nothing. Otherwise, the amount of the die roll (from $\$2–\$6$) is added to the pot, and the player gets another move. The player continues rolling until they either get a $1$, y cobro nada, o la opción de llevarse el bote. Nos gustaría encontrar la estrategia óptima para este juego, y el beneficio esperado bajo la estrategia óptima.
Un simple (pero no es del todo correcto), el análisis va de esta manera: Cualquier estrategia racional debe tomar la forma de "Stop si y sólo si el bote tiene un valor de al menos $\$S$." If the pot contains $\$P$, a continuación, la ganancia esperada de la próxima tirada de dados es $\frac16(-P+2+3+4+5+6 )$ dólares. Esto es positivo siempre que $P\ge 20$, por lo que el jugador debe rodar hasta que el bote llega a $\$20$ o más y, a continuación, dejar y recoger.
De hecho, esta es una estrategia óptima, pero el análisis no es exactamente correcto, porque se supone, erróneamente, que la ganancia esperada por el éxito de la tirada de dados es exactamente $\$4$. But actually the expectation is a little bit more than this, because a successful die roll not only adds $\$4$ a la olla, que permite la posterior morir rollos que se pueden agregar más. De hecho, las estrategias de $S=20$ $S=21$ rendimiento idéntico espera que las rentabilidades de $\$8.141794893727$.
Un análisis más profundo de la siguiente manera: Vamos a $X_S(P)$ ser el esperado de la cantidad ganada por la siguiente parada-a-$S$ estrategia al $\$P$ is already in the pot. Then $X_S$ satisface la siguiente inusual de recurrencia:
$$X_S(P) = \begin{cases} P & \text{if %#%#%} \\ \frac16\sum_{i=2}^6 X_S(P+i) & \text{otherwise} \end{casos} $$
Estamos interesados en el comportamiento de $P\ge S$, la cual se puede calcular exactamente el uso de esta recurrencia. Esto es tedioso, así que he tenido el ordenador. $X_S(0)$ está maximizada, como ya se ha mencionado, para$X_S(0)$$S=20$.
Mis preguntas son:
- Hay un método más sencillo para calcular el $S=21$ sin la ayuda de la computadora?
- Hay un argumento que muestra que $X_S(0)$?