6 votos

Qué equidad es necesaria para ofrecer el cubo de doblar en Backgammon (juego de dados)

Editar: Esta pregunta es mucho más corta de lo que es. No te sientas intimidado. Si conoces el backgammon, pasa a la pregunta 2.

En el Backgammon, cada partida se juega por un punto (o un dólar) entre dos jugadores. Hay un dado, llamado cubo duplicador que tiene los números $2, 4, 8, ...$ En el centro del tablero (no es "propiedad" de nadie). Los jugadores tiran por turnos dos dados normales (no el cubo de doblar) y se mueven. Pero antes de cada tirada, un jugador puede "ofrecer el cubo" (u "ofrecer doblar", "doblar", etc.) que es básicamente decir "Oye, ¿por qué no jugamos este juego por 2 puntos?". El otro jugador puede gota a gota o rechazar el cubo, y perder un punto, o puede aceptar o toma El cubo, en cuyo caso el juego continúa por el doble de puntos que antes.

Un jugador equidad en el juego es la probabilidad de que gane una partida sin cubos, donde sin cubos significa que ningún jugador puede ofrecer el cubo (o un juego de un punto). (Para los jugadores de backgammon que conocen las reglas, estoy ignorando los gammons y los backgammons, por lo que la equidad es igual a la probabilidad de ganar. Editar: Como indica la primera respuesta de @Henning Makholm, tampoco quiero incluir la equidad de poseer el cubo de la duplicación.

Tengo dos preguntas, pero sé la respuesta a la primera y creo que la estoy calculando bien.

1) ¿Qué fondos propios tiene el jugador? recibiendo el cubo para aceptarlo? La respuesta, me dicen, es $.25$ ?

El jugador receptor aceptará el doble cuando el valor esperado de cogerlo sea mayor que el valor esperado de dejarlo (lo que le hace perder automáticamente $1$ punto). $p$ es la probabilidad (igual a la equidad) de que el jugador receptor gane (¿están siguiendo todo esto?).

$E(take) \ge E(drop) \\ 2p-2(1-p) \ge -1 \\p > .25$

Estoy casi seguro de que eso es correcto, así que

2) ¿Qué capital se requiere para que un jugador ofrezca el cubo (ofrecer doblar las apuestas del juego)?

¿Cómo se calcula? No sabemos si el destinatario del cubo aceptará o no.

Empiezo igual que la pregunta 1: El dador doblará cuando su valor esperado de doblar sea mayor que su EV de no doblar (¡duh!). Si $EV(rolling)$ es $p-(1-p)$ y $EV(doubling)$ es $2p-2(1-p)$ entonces

$E(doubling) > E(rolling) \\ 2p-2(1-p) > p-(1-p) \\ p > .5$

Lo cual no puede ser correcto. Aunque no soy un experto en BG, solía jugar por (pequeñas cantidades) de dinero en NYC. No hay forma de que yo doble con un 51% de posibilidades.

Bien, eso es todo lo que tengo. ¿Cómo lo resolvemos? Gracias.

7voto

sewo Puntos 58

Supongamos que usted y su oponente son maestros analistas, por lo que ambos conocen siempre la equidad con exactitud. De todos modos, es un juego de información completa.

Creo que la razón por la que no doblarías con una ventaja del 51% es que después de doblar, pierdes el derecho a hacerlo de nuevo hasta que tu oponente haya redoblado la apuesta.

Si doblas con un 51% de ventaja, la partida sigue (ignorando el cubo de doblar) casi igualada. Si tienes mala suerte con los dados y luego te encuentras con un 21%, tu oponente puede ofrecerte un redoble, que rechazarías, perdiendo la partida. Por otro lado, si la cosa va exactamente al revés y te encuentras con un 79%, ya no tienes esa opción; tendrás que jugar hasta que ganes de verdad antes de haber ganado.

Así que para un juego con una equidad más o menos pareja, poseer el cubo de doblar es una ventaja bastante significativa, que no estás incluyendo en los cálculos de la pregunta. Cómo La importancia de esta ventaja no puede cuantificarse únicamente en términos de equidad, sino que también hay que tener en cuenta la probabilidad de que se produzcan cambios bruscos en la equidad durante el resto de la partida, y en qué dirección.

Por ejemplo, consideremos una situación idealizada (sin equivalente directo en el backgammon real), en la que el jugador A ganará automáticamente en 25 turnos a menos que el jugador B saca un 1-1 antes de que eso ocurra, en cuyo caso B gana instantáneamente. En esta posición, cada jugador tiene una probabilidad de ganar de aproximadamente el 50%, pero tener la posibilidad de doblar no les afectaría por igual. No tendría sentido que B ofreciera nunca un doble, pero A obtendrá un beneficio neto al ofrecer un doble cuando queden unos 9 turnos (momento en el que B debería rechazar).

Esto también muestra que aceptar un doble puede tener mayor valor esperado que rechazar incluso con menos del 25% de equidad, y dado un juego óptimo.

7voto

sewo Puntos 58

Aquí hay un análisis que trata de tener en cuenta los redoblamientos y la propiedad del cubo. Se basa en ignorar completamente el actual juego del backgammon y sustituyendo la suposición (bastante contrafactual) supuesto de que el juego subyacente es un simple movimiento browniano: El juego comienza colocando una ficha en el punto 0,5 de una escala de 0 a 1. El contador realiza entonces un paseo aleatorio unidimensional en tiempo continuo. tiempo continuo. Cuando llega a 1 o a 0, el juego termina y el jugador A o B, respectivamente, es declarado ganador. Mientras el juego está en curso, los dos jugadores tienen la opción de doblar y redoblar en en cualquier momento, pero de acuerdo con las reglas de doblaje del backgammon. reglas de backgammon.

En este juego, la única elección que tiene que hacer el jugador es cuándo ofrecer el cubo. Su estrategia puede resumirse en dos números $k$ y $\lambda$ . Cuando un jugador posee el cubo de doblar, ofrecerá una redoble en cuanto la posición sea $k$ o más; ofrecerá el primero doblando cuando la posición alcanza $\lambda$ por primera vez. La situación antes de la primera duplicación es sensiblemente diferente de cuando el cubo tiene dueño, por lo que $\lambda$ puede diferir de $k$ pero ya que un paseo aleatorio es simétrico bajo los desplazamientos de tiempo, no hay razón para para considerar estrategias en las que $k$ cambia a medida que el juego envejece.

Vamos a encontrar el óptimo $k$ primero. Considere dos funciones $f$ y $g$ tal que $f(p)$ es el esperado valor del juego (para el jugador que gana en $p=1$ y asumiendo un juego óptimo) en la posición $p$ Dado que el jugador posee el cubo que el jugador posee el cubo, y $g(p)$ es el valor esperado cuando el jugador no posee el cubo. Estos valores esperados son siempre entre $0$ y $1$ ; nos imaginamos que ya hemos pagado $\frac 12$ en el bote que el ganador se llevará a casa.

Por simetría debemos tener (si ambos jugadores juegan de forma óptima, lo que significa en particular que su $k$ s son los mismos): $$g(p)=1-f(1-p)$$ Mira el valor del juego en la posición $k$ cuando estamos a punto de ofrecer un redoble; llamemos a este valor $v$ . Entonces $$v=f(k) = \min(1, 2 g(k) - \frac12)$$ El $\min$ es porque el oponente sólo aceptará el doblaje si si hacerlo le resulta más ventajoso que rechazarlo. Restando $\frac 12$ de doblar el bote (o en otras palabras, para la palabras, por el riesgo de que finalmente perdamos 2 unidades en lugar de 1).

Ahora, está claro que debemos redoblar al menos tan pronto como el punto en el que un oponente racional lo rechazaría desde ese punto, esperar más tiempo no nos va a aportar nada. Así que podemos eliminar la $\min(1,\ldots)$ y sólo recuerda que $k$ debe ser elegidos de forma que $v\le 1$ . Entonces tenemos $$\tag{1} v = 2g(k)-\frac12 = 2(1 - f(1-k))-\frac 12 = \frac32 - 2f(1-k)$$

Cuando $p$ está entre $0$ y $k$ el valor del juego depende de la probabilidad de que la posición alcance $k$ antes de que llegue a $0$ . En una maravillosa propiedad del movimiento browniano, esta probabilidad es simplemente $p/k$ , por lo que tenemos $$\tag{2} f(p) = \frac pk f(k) = \frac vk p$$ Claramente, para un juego óptimo debemos elegir $k$ tal que la constante de proporcionalidad $\frac vk$ es lo más grande posible. Para encontrar la relación entre $v$ y $k$ especializar (2) en $p=1-k$ : $$ f(1-k) = \frac{1-k}{k} v$$ y telescopio que en (1): $$ v = \frac 32 - 2\frac{1-k}{k} v \quad\Longrightarrow\quad v = \frac{3k}{4-2k}$$ Así, $\frac vk$ que estamos tratando de maximizar, es $\frac{3}{4-2k}$ . Esto aumenta monotónicamente con $k$ Así que queremos tener $k$ tan grande como sea posible. Pero, como se ha argumentado anteriormente, no podemos tener $v>1$ por lo que encontramos el óptimo $k$ resolviendo $1=v=\frac{3k}{4-2k}$ para $k$ . Esto da como resultado $$k=0.8$$ para un juego óptimo una vez que se posee el cubo de doblar.

Ahora estamos listos para encontrar $\lambda$ . Al principio del juego la situación es simétrica, por lo que si ambos jugadores siguen la misma estrategia (óptima) estrategia, cada jugador hará la primera oferta de doblar con probabilidad $\frac 12$ . El objetivo es entonces maximizar el valor del juego después de que de que se produzca esa primera duplicación: $$ g(\lambda) = 1-f(1-\lambda) = 1 - \frac{1-\lambda}k = 1.25\lambda - 0.25$$ que se maximiza eligiendo $\lambda$ tan grande como sea posible. Pero como antes, la elección de un $\lambda$ tan grande que el adversario rechaza nuestro doblar es un desperdicio. Así que, de hecho $\lambda$ debe elegirse justo en el umbral en el que el adversario empezaría a rechazar el doblar. Pero resulta que ese es el mismo criterio que se utilizó para encontrar $k$ Así que, de hecho $\lambda=k$ es óptima.

Conclusión: Para el juego óptimo con doblajes y redoblajes, suponiendo que el backgammon puede ser modelado como un movimiento browniano:

  • Ofrezca doblar o redoblar en cuanto su posición sea del 80% o más.
  • Acepte una oferta de duplicación o redoblamiento si su posición es mejor que el 20%.

Ejercicio: demostrar que con esta estrategia, no importa qué estrategia su oponente sigue, su resultado neto esperado de un juego nunca es negativo.

5voto

Lars Tackmann Puntos 152

En realidad se puede hacer algo mejor que la aproximación del 20%/80%.

Rick Janowski escribió un artículo al respecto aquí:

http://www.bkgm.com/articles/Janowski/cubeformulae.pdf

Dos grandes innovaciones en ese documento:

  • Quieres tener en cuenta la posibilidad de gammones y contragammones. Para ello, se supone que la proporción de victorias del gammon (y la proporción de victorias del backgammon) se mantiene constante a medida que cambia la probabilidad de ganar. Lo mismo ocurre con las pérdidas de gammon/backgammon.
  • Señaló que lo del 20%/80% anterior es un límite de "cubo vivo". Supone que la probabilidad de ganar se difunde continuamente, cuando en realidad salta de un turno a otro. Por ello, puedes esperar hasta antes del punto de caja para ofrecer el doble, capturando todo el valor teórico. En realidad, debido a que podría saltar al otro lado del punto de caja, querrá doblar antes que justo antes del punto de caja. Así que el límite del "cubo vivo" es un límite superior a la equidad del cubo apropiado. El límite del "cubo muerto", en el que no asignas ningún valor a la posesión del cubo, es un límite inferior. Janowski propuso una interpolación lineal en la equidad entre esos dos límites; el parámetro de interpolación lineal es un proxy para todas las cosas complicadas sobre los saltos en la probabilidad, el tamaño de la ventana de duplicación, etc.

Con esto se pueden obtener expresiones relativamente sencillas para los puntos de toma y de caja, así como los puntos dobles y redobles iniciales. Todo está en ese documento, que es un verdadero clásico.

También he trabajado un poco en esto, modelando los cambios de probabilidad como saltos en lugar de una difusión continua. Todavía es un poco tosco, pero si te interesa puedes verlo aquí:

http://compgammon.blogspot.com/2012/03/new-cube-decision-model-posted-on.html?showComment=1333785363926

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X