9 votos

Juego "Blackjack" de dados de 100 caras

Estoy tratando de determinar dos variables en este juego:

  1. La estrategia óptima: (Lo que el número que el jugador debe permanecer en el)
  2. El valor esperado dado un juego perfecto: (El por ciento de retorno sobre una apuesta al uso de la estrategia óptima)

Aquí es cómo funciona el juego: Hay dos jugadores. Uno es el "distribuidor" y el otro es el apostante. Una apuesta es colocada, y el "dealer" rollos de dados de 100 caras, tener los números del 1-100. El apostador quiere obtener cerca de o a 100, sin pasarse. Si van más de 100, que "busto" y perder el juego. El primer rollo(s) son para el jugador, y que tienen la opción de golpe o de estancia hasta que pase o elegir para su estancia. Cada vez que un jugador golpea, los números se suman. Después de que el jugador se queda, el distribuidor de rollos hasta que batir la mejor puntuación, dibujar, o el busto. En el caso de un empate, el jugador tendrá su dinero de vuelta.

Ejemplo de juego: El distribuidor de rollos para el apostador y el 100 colindado mueren muestra de 60. El apostador decide quedarse. Ahora, el distribuidor de rollos para ellos mismo y el 100 colindado mueren muestra que una 3. El distribuidor golpea, rodando un 8. El distribuidor agrega estos números, y es a las 11. El distribuidor de rollos de nuevo y el dado muestra un 50. El distribuidor añade 50 y 11, haciendo 61. El distribuidor ha latido el apostador sin ir más de 100, ganar el juego.

Información adicional: he intentado mi mejor para determinar la estrategia óptima y retorno de la inversión para este juego, pero la matemática es demasiado complejo para mí. Hay demasiadas variables que intervienen y cuando varios rollos vienen en el juego se convierte en algo abrumador para comprender plenamente. Sólo tengo conocimientos básicos de estadística y probabilidad. La ayuda es muy apreciada.

4voto

CodingBytes Puntos 102

En el siguiente voy a tratar el continuo de la versión del juego: El rodar de los dados es modelada por el dibujo de un número real distribuidos de manera uniforme en $[0,1]$.

Sólo el apostante puede tener una estrategia, y esta estrategia es completamente caracterizada por un cierto número $\xi\in\ ]0,1[\> $. Se lee como sigue: Dibujar, una vez más, si la suma de $x$$<\xi$, y la estancia si la suma es $>\xi$. El problema es encontrar el óptimo $\xi$.

Reclamo: Cuando el jugador se queda en algunos $x\in[0,1]$ su probabilidad de $q(x)$ de perder es $=(1-x)e^x$.

Prueba. El jugador pierde si los sucesivos dibujos de el distribuidor producir una suma parcial $s_{n+1}$ en el intervalo de $[x,1]$. Esto significa que hay un $n\geq0$$s_n\leq x$$x\leq s_{n+1}\leq1$. La probabilidad de $s_n\leq x$ es fácilmente visto a ${x^n\over n!}$, y la probabilidad de que el siguiente dibujo causas $s_{n+1}$, se encuentra en el intervalo dado de longitud $1-x$$1-x$. De ello se sigue que $$q(x)=\sum_{n=0}^\infty{x^n\over n!}\>(1-x)=(1-x)e^x\ .$$

De esto podemos extraer la siguiente conclusión: Si el jugador ha acumulado $x$ y decide hacer un sorteo adicional, a continuación, sus posibilidades de perder son $$\tilde q(x)=\int_x^1 q(t)\>dt\>+x =(2-x)e^x+x\ ,$$ mediante el cual el $+x$ al final es la probabilidad de pasarse.

La función de $x\mapsto q(x)$ es la disminución en $[0,1]$, e $\tilde q$ es creciente en este intervalo, el cual $q(x)=\tilde q(x)$ al$x=\xi$$\xi\doteq0.570556$. Al$x<\xi$$\tilde q(x)<q(x)$. Esto significa que un dibujo adicional en $x$ disminuye la probabilidad de perder. Al$x>\xi$, lo contrario también es cierto: Un dibujo adicional aumentaría la probabilidad de perder.

1voto

p.s. Puntos 2897

Me gustaría este enfoque esencialmente por trabajar hacia atrás. En primer lugar, usted puede averiguar lo que el distribuidor de probabilidades se si el mejor resultado es fijo. Vamos $p_w(m,n)$, $p_d(m,n)$, $p_l(m,n)$ ser las probabilidades de que el dealer gana, se saca o se pierde, respectivamente, si su total actual es $n$ y el jugador del total $m$. (Suponga que el apostador no ha perdido ya y $m \le 100$.) $$ \begin{aligned} p_w(n,m) &= \begin{cases} 1 & n > m \\ 0 & n = m \\ \frac{1}{100} \sum_{k = n+1}^{100} p_w(k,m) & n < m \end{casos}\\ p_d(n,m) y= \begin{cases} 0 & n > m \\ 1 & n = m \\ \frac{1}{100} \sum_{k = n+1}^{100} p_d(k,m) & n < m\end{casos}\\ p_l(n,m) y= \begin{cases} 0 & n \ge m \\ \frac{n}{100}+\frac{1}{100} \sum_{k = n+1}^{100} p_l(k,m) & n < m\end{casos}\end{aligned} $$ A continuación, de forma recursiva la aplicación de las fórmulas, al $n<m$ tenemos: $$ \begin{aligned} p_w(n,m) &= 1-\frac{m}{100} + \frac{1}{100} \sum_{k = n+1}^{m-1} p_w(k,m) \\ p_d(n,m) &= \frac{1}{100}+\frac{1}{100} \sum_{k = n+1}^{m-1} p_d(k,m)\\ p_l(n,m) &= \frac{n}{100}+\frac{1}{100} \sum_{k = n+1}^{m-1} p_l(k,m) \end{aligned} $$ Así que toma nota de $p_w(n,m)=p_w(n+1,m)+\frac{1}{100}p_w(n+1,m)$, obtenemos la forma cerrada de las fórmulas de al $n<m$: \begin{aligned} p_w(n,m) &= (1+1/100)^{m-n-1} (1 - m/100)\\ p_d(n,m) &= (1+1/100)^{m-n-1} (1/100)\\ p_l(n,m) &= 1-p_w(n,m)-p_d(n,m) \end{aligned} Así que si el jugador se queda con un total de $m$, la del crupier, las probabilidades son: \begin{aligned} p_w(m) &= (1+1/100)^{m-1} (1 - m/100)\\ p_d(m) &= (1+1/100)^{m-1} (1/100)\\ p_l(m) &= 1-p_w(n,m)-p_d(n,m) \end{aligned}

Para calcular el beneficio esperado, vamos a utilizar la convención de que si el apostador gana su rentabilidad es $+1$, si pierde su rentabilidad es $-1$, y si él saca su rentabilidad es $0$. Si el jugador permanece en el valor de $m$, su beneficio esperado se $p_l(m)-p_w(m)$.

Deje $v(m)$ ser el valor esperado de la apostador ganador si su total actual es $m$ y que él está jugando para maximizar su beneficio esperado. Entonces podemos estar calcular recursivamente como este: $$ v(m) = \max\left( p_l(m)-p_w(m), -\frac{m}{100}+\frac{1}{100}\sum_{k=m+1}^{100} v(m) \right) $$ Por mis cálculos, me parece que el apostador debe seguir rodando hasta que él ha $58$ o más, y se espera que la rentabilidad es $\approx -0.14674914$.

0voto

Estoy mirando estos resultados que se ven muy bien, ¿sería posible obtener una solución si los dados era $0$ $100$ $101$ incluso por casualidad los resultados?

¿Además, suponiendo que el número óptimo en el que reposar es $x$, y jugué usando esta estrategia, lo que mi % victoria/empate/perder sería?

Gracias de antemano

J

-1voto

Masacroso Puntos 1080

Podemos empezar a ver si podemos encajar con algún nivel de riesgo.

Para mí una buena máximo riesgo está asumiendo un 25% de probabilidades de perder, porque en 50% el juego es puramente al azar (y más del 50% está loco).

Luego al llegar a un número igual o mayor a 25 tengo un 25% o más de perder intentar sumar algo más. Pero tengo también un 75% de perder debido a un poco de fortuna juego de distribuidor.

Así que, si yo no juego más, voy a tener un 75% de perder. Así que el mejor escenario que tenemos es cuando se alcance un número igual o mayor a 50, debido a que la probabilidad de que se pierde si se vuelve a tirar es la más cercana a la probabilidad de perder vs el distribuidor.

Así que el mejor número para hospedarse es el primer rollo que alcanzan o superan el 50... en cualquier otro escenario sus posibilidades de ganar inferior, debido a que son cerca de 100 o porque las probabilidades de que el distribuidor es mejor que la tuya.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X