6 votos

Los jugadores A y B lanzan repetidamente una moneda (posiblemente injusta) hasta que uno pierde todo. Cada uno comienza con una cantidad de dinero diferente

Hay dos jugadores $A$ y $B$ . Al principio $A$ tiene $a_0 [0,1]$ cantidad de dinero y $B$ tiene $b_0 = 1 - a_0$ cantidad de dinero. Tienen una moneda posiblemente injusta que lanzan repetidamente. $A$ siempre adivina $Heads$ y $B$ siempre adivina $Tails$ . Antes de cada tirada, ambos apuestan un mínimo de lo que cada uno tiene (es decir $bet_i = min(a_i, b_i)$ ). Después de lanzar la moneda, el ganador se lleva el $bet_i$ y vuelven a jugar hasta que uno de ellos no tiene más dinero para jugar.

Llevo tiempo pensando en ello y no he podido encontrar una fórmula cerrada ni la he encontrado mencionada en ningún sitio. Así que se agradecería cualquier otra información.

Lo mejor que pude hacer fue una simulación. Curiosamente parece que cuando la moneda es justa, la probabilidad de $A$ ganar es proporcional a $a_0$ pero cuando la moneda es injusta, el gráfico tiene un aspecto más peculiar:

Aquí, el eje horizontal representa $a_0$ y la vertical representa $P(A\ wins\ given\ that\ the\ coin\ is\ fair)$

P(A wins given that the coin is fair)

En el siguiente gráfico, el eje horizontal también representa $a_0$ y la vertical representa $P(A\ wins\ given\ that\ the\ coin\ ends\ up\ Heads\ 1\ in\ 3\ times)$ .

enter image description here

El código de la simulación se encuentra en aquí .

0 votos

Por lo que veo, la única pregunta que tiene es una petición de más información. Creo que deberá ser más específico. Sin embargo, la idea que subyace a tus preguntas es intrigante.

0 votos

Principalmente si existe una fórmula cerrada, Aunque sólo para algunos casos especiales (por ejemplo, es fácil si $a_0 = b_0$ ). O si el problema tiene un nombre por el cual podría buscar más en Google. Además, el área bajo la curva parece ser igual a $P(coin\ ends\ up\ Heads)$ lo cual es interesante para mí.

0 votos

Tal y como lo describes, el jugador con la menor cantidad está "all in" y este juego debería terminar la primera vez que ese jugador pierda su apuesta.

4voto

saulspatz Puntos 116

En realidad, esto se ha analizado, al menos desde el punto de vista del jugador que tiene la peor de las cosas. El juego que describes es equivalente a lo siguiente. Un jugador juega una partida en un casino. Su probabilidad de ganar es $p<\frac12.$ Cuando gana una apuesta, gana el importe de la misma. Empieza con un fondo $< 1$ y los intentos de elevarlo a $1$ . La idea es que necesita $1$ para algún propósito importante, y si no lo tiene, es mejor que no tenga nada.

Así, en cada apuesta, apuesta todo lo que tiene, si su bankroll es menor o igual a $1/2$ o lo suficiente para elevar su saldo bancario a 1, si tiene más de $1/2,$ así que si tiene $.8,$ apuesta $.2.$ Por supuesto, se detiene cuando se arruina, o cuando ha aumentado su bankroll a $1.$

Esto se demostró como la mejor estrategia en "How to Gamble if You Must", de Dubins y Savage. Deje que $f(x)$ sea la probabilidad de ganar si el bankroll actual es $x$ . Entonces $$ f(x)=\cases{p+(1-p)f(2x-1),&$ x\geq\frac12 $\\ pf(2x),&$ x<frac12 $} $$ También, por supuesto, $f(0)=0, f(1)=1.$ Es fácil calcular los valores en los racionales diádicos. $f(.5)=p, f(.25)=p/2, f(.75)=(1+p)/2,$ etc.

Vi un análisis de $f$ en algún lugar hace años, y no puedo recordar dónde. Estaba en un libro de divulgación científica, que sólo afirmaba los resultados, y tuve que probarlos por mí mismo. Si no recuerdo mal, $f$ es continua y estrictamente creciente (no es una sorpresa), pero es totalmente indiferenciable. Por supuesto, como es monótona, debe ser diferenciable en casi todas partes, pero lo que creo recordar es que no es diferenciable en ningún intervalo, y que la gráfica no es rectificable.

Dado que cualquier $0<x<1$ se puede aproximar de forma arbitraria mediante racionales diádicos, y $f$ se puede calcular exactamente en los racionales diádicos, $f(x)$ puede calcularse con la precisión deseada sin necesidad de simulación. Ahora que lo pienso, hay una fórmula que calcula $f(x)$ de la fracción binaria para $x$ . En ese sentido, existe una fórmula de forma cerrada.

La fórmula para $f$ es válida independientemente de que $p<\frac12$ pero no sé qué parte del análisis se sostiene en ese caso.

EDITAR

Acabo de darme cuenta de que mi memoria me juega una mala pasada, al menos en un aspecto. La función debe ser continua y monótona, por lo que su gráfica no puede ser irrectificable. Una función monótona es de variación acotada, y según el Teorema 5.1 de este documento una función continua es de variación acotada si y sólo si su gráfica es rectificable. Voy a tener que tomarme un tiempo para analizar esta función.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X