16 votos

La estrategia óptima para el Jackpot Rock Paper scissors

Jackpot Rock Paper scissors es un juego de azar variante de Rock Paper scissors, en donde los lazos resultado de la apuesta se llevaron adelante en un bote.

Si un jugador juega de la misma mano (piedra, papel o tijeras) 3 o más turnos consecutivos de triunfos y en la que a su vez ... de ganar el premio mayor total, y el juego termina.

Cada turno, el jugador debe apostar $1. The possible outcomes:

  • Winning: You get $2 (su dinero de vuelta, y los oponentes)

  • Perder: Usted pierde la apuesta de 1 $cantidad (que se da al oponente)

  • Empate: Usted y su oponente pierde $1. El bote aumenta por 2 dólares.

Para evitar problemas con el juego (y el infinito juegos), si 1000 vueltas y transcurriendo el juego no ha terminado y el premio mayor es de división de 50-50,


El objetivo del juego es maximizar sus propias ganancias -- no necesariamente ganar el premio mayor.

Ejecución de una simple simulación, juego puramente al azar -- me estas estadísticas:

--- Random  vs  Random  (over  1000000  games) ---
 Expected Return:  -0.0212 
 Average turns:  48.355552 
 Average jackpot:  32.245392 
 Biggest jackpot:  440 
 Longest Game:  600  turns 
 Biggest Win:  210 
 ----------------------

Sin embargo, he trivialmente sido capaz de batir a puro juego de azar en mi simulaciones (dar más de sesgo para un juego que iba a ganar el jackpot), y trivialmente sido vencer a esa estrategia. Lo que no he sido capaz de hacer, sin embargo, es venir con una estrategia que no puedo superarme a mí mismo.

Así que me puse a usted: Para un juego, ¿cuál sería la estrategia óptima?

4voto

Mark Fischler Puntos 11615

Llame a las estrategias de piedra, papel, tijeras y Un, B, y C: C beats B latidos latidos C. La etiqueta de las posiciones posibles en este juego de con $2(n-1)$ dólares en el bote como: $T_{n-1}$ si el anterior resultado fue un empate; $G_{n-1}$ si el jugador I tiene una racha ganadora de 1 utilizando la estrategia a (donde a puede ser cualquier de piedra, papel o tijeras); o $H_{n-1}$ si el jugador I tiene una racha ganadora de 2 utilizando la estrategia de Una (y por lo tanto, tomar el bote si gana la próxima ronda el uso de la estrategia). Estamos usando $n-1$ de la cantidad en el bote, en lugar de $n$ para algebraicas comodidad a la hora de la presentación de la sub-juego de matrices.

(Claramente, esto omite los casos donde el jugador II tiene una racha ganadora, pero los valores de los puestos de $G^{-}_{n-1}$ $H^{-}_{n-1}$ son sólo los aspectos negativos de los valores de los correspondientes $G_{n-1}$ $H_{n-1}$ posiciones).

Deje que el valor de cualquier posición en este juego de ser el óptimo valor de la partida, menos el resultado de que pasaría si los jugadores fueron a dejar de hacerlo y se reparten el bote. A continuación, por simetría $V(T_{n-1}) = 0$ todos los $n >0$ y la estrategia óptima para cualquier $T_{n-1}$ posición es la trivial de elegir a, B, o C, cada uno con probabilidad 1/3.

Debido a que el valor de $T_{n-1}$ es igual a cero, en la posición de los análisis de los valores y estrategias no se ven afectados si fuéramos a decir que no importa cómo la $2(n-1$ dólares se metió en el bote, y que en caso de empate, el juego termina por dividir el bote (y que los jugadores. Por lo que el juego en general para un cierto valor de $n-1$ se caracteriza por que de 4 posiciones que usted está en.

De $G_{n-1}$ el juego final (por un empate, en cuyo caso los jugadores reiniciar el juego en $T_n$ pero desde que tiene valor cero no nos importa), la transición a la $H_{n-1}$ con reproductor me ganando un dólar, o la transición a $G^{-}_{n-1}$ con el jugador de la II ganando un dólar.

De $H_{n-1}$ el juego puede terminar en empate, la transición a la $G_{n-1}$ con reproductor me ganando un dólar después de haber ganado utilizando la estrategia B o C, la transición a la $G^{-}_{n-1}$ con el jugador de la II ganando un dólar, o el final con el jugador que ganar el bote (aumentando $n$ dólares en total) por ganar la utilización de la estrategia de A.

Para $n=1$, sin dinero en el bote, no es la ventaja de todo para tener una racha ganadora, los valores de posición son todos cero, y las estrategias óptimas son el trivial de igual probabilidad de estrategias. Todas las características más interesantes están en los juegos donde hay algo en la olla.

El juego dos matrices (por $n>1) son: $$ G_{n-1} = \left( \begin{array}{ccc} 0 & -g & h \\ +g & 0 & -g \\ -g & g & 0 \end{array} \right) $$ (donde por conveniencia presentamos $g \equiv 1+V(G_{n-1})$$h \equiv 1+V(H_{n-1})$) y $$ H_{n-1} = \left( \begin{array}{ccc} 0 & -g & n \ +g & 0 & -g \ -g & g & 0 \end{array} \right) $$

$$ H_{n-1} = \left( \begin{array}{cc|c} 0 & -g & n \\ +g & 0 & -g \\ -g & g & 0 \end{array} \right) $$

Para solucionar $G_{n-1}$ hacemos el habitual mantra de restar columnas y tomando determinantes: $$ G_{n-1}: \begin{array}{ccc|cc|c} 0 & -g & h & g & -h & 3g^2 \\ +g & 0 & -g & g & 2g & g^2 + 2hg \\ -g & g & 0 & -26 & -g & 2g^2 + hg \\ \hline -g & g & h+g & & & \\ g & -2g & h & & & \\ \hline 2g^2 + hg & g^2 + 2hg & 3g^2 & & & \end{array} $$ El juego valor es $\frac{hg-g^2}{3h+g6}$. Así $$ g = 1 + V(G_{n-1}) = 1 + \frac{hg-g^2}{3h+g6} $$

Del mismo modo, se resuelve $H_{n-1}$: $$ H_{n-1}: \begin{array}{ccc|cc|c} 0 & -g & n & g & -n & 3g^2 \\ +g & 0 & -g & g & 2g & g^2 + 2ng \\ -g & g & 0 & -26 & -g & 2g^2 + ng \\ \hline -g & g & n+g & & & \\ g & -2g & n & & & \\ \hline 2g^2 + ng & g^2 + 2ng & 3g^2 & & & \end{array} $$ El valor de la partida es $\frac{hg-g^2}{3h+g6}$. Así $$ h = 1 + \frac{ng-g^2}{3n+g6} $$

Antes de trabajar con estas dos ecuaciones, se puede ver la situación de $n$ muy grande. Allí, $ h = 1 + g/3 + O(1/n)$ y podemos sustituir a encontrar que $$ \begin{array}{l} g = \frac{15+\sqrt{1053}}{46} \approx 1.031521 \\ V(G_{\infty}) \approx 0.031521 \\ h = 1 + g/3 \approx 1.34384 \\ V(H_{\infty}) \approx 0.34384 \end{array} $$ Es decir, con una olla muy grande, si el jugador I tiene una racha de 2 victorias Una estrategia de juego, el jugador II muy rara vez (la probabilidad de $\frac{3g}{3N+6g}$) riesgo utilizando la estrategia C, lo que podría resultar en la pérdida de la totalidad del bote. Jugador que casi siempre van a elegir las estrategias de B (alrededor de 2/3 de los casos) o C (1/3), y el juego es favorable para el jugador I, con un valor de $+\frac{1}{3}$. Y si el jugador 1 tiene solo 1 juego racha ganadora, entonces los aproximadamente 1.33 recompensa en la esquina superior derecha (a $H_{n-1}$ con otra, Un win) los sesgos del juego en el jugador que a favor, pero sólo por unos 0,03.

Bien, ahora veamos el caso de $n$ no es grande suficiente para ignorar $1/n$ efectos: Sustituir la expresión para $h$ en la expresión de $g$ encontramos $$ 40g^3 + (23n-21)g^2 - (15n+18)g - 9n = 0 $$

Así, por ejemplo, si no es $2 \times 1$ dólares en el bote ( $n = 2$ ), entonces el valor del juego para un jugador con una racha ganadora es $G_1 \approx 0.008118$ y el valor de un dos juego racha ganadora es $G_1 \approx 0.082991$. En el juego de $G_1$ la estrategia para el jugador I es elegir Una (la racha ganadora de la elección) a (B), que late A) a C en relación $$ 3g : g + 2h : 2g + h = 3.024 : 3.172 : 3.099 $$ y en el juego de $H_1$ los coeficientes son $$ 3g : g + 2n : 2g + n = 3.024 : 5.008 : 4.016 $$ El juego de los valores de $n = 11$ (diez dólares en el bote) $G_{10} = 0.024413$ y $H_{10} = 0.261048$; las estrategias para el jugador 1 en el juego de $H_{10}$ están en relación de $$ 3.073 : 21.049: 1.024 \aprox 1 : 7 : 4 $$ y para el jugador II están en relación de $$ 2n+g : n+2g : g 3 = 21:024 : 12.049 : 3.073 \aprox 7 : 4 : 1 $$ para a, B y C, en ese orden.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X