13 votos

Jugando la Lotería de San Petersburgo hasta que lo pierda todo

Esta pregunta continúa la siguiente pregunta: Calculando la probabilidad de ganar al menos $128 dólares en una lotería Paradoja de San Petersburgo

Aquí está la lotería: Se lanza repetidamente una moneda justa hasta que produzca "cara". Si la primera aparición de cara es en el lanzamiento $n$, se le paga $2^{n1}$. Entonces, por ejemplo, si cara aparece en el primer lanzamiento, se le paga 1 dólar; si cara aparece por primera vez en el segundo lanzamiento, se le paga 2 dólares, y así sucesivamente.

Digamos que el costo de entrar en la lotería es de 10 dólares y comienzo con 100 dólares. Jugaré la lotería una y otra vez hasta tener más de 10 dólares para jugar el juego.

Ahora mi pregunta es, ¿cuál es la probabilidad de que pueda seguir jugando el juego?

Ejemplo: Digamos que durante el primer juego, obtengo una cara en el primer lanzamiento, entonces me quedaré con 91 (=100-10+1) dólares. Jugaré el juego nuevamente pagando 10 dólares y esta vez puedo obtener una cara en el lanzamiento 7 y ahora tendré 145 (=91-10+64) dólares y así sucesivamente.

Editar: ¿Es posible encontrar la probabilidad de sobrevivir a la enésima ronda dado que he sobrevivido a todas las rondas anteriores??

3voto

No veo un enfoque sencillo, así que intenté una simulación en R usando el siguiente código, el cual verifica si pierdes en el primer millón de juegos, repetido $100000$ veces:

set.seed(2015)
subjuegos   <- 10
supersjuegos <- 100000 # el máximo de juegos es supersjuegos*subjuegos
casos      <- 100000 
ganancia     <- function(x, y=10){ ifelse(y<10, y, y + 2^-ceiling(log(x,2)) -10) }
posición <- matrix(rep(NA,(subjuegos+1) * casos), nrow=casos)
posición[, 1] <- 100 # comenzar con 100
for (r in 1:supersjuegos){
    subcasos <- nrow(posición)
    udatos <- matrix( runif(subjuegos * subcasos ), nrow=subcasos )
    for (n in 1:subjuegos ){ posición[, n+1] <- ganancia(udatos[,n], posición[,n]) } 
    posición[, 1] <- posición[, subjuegos+1]     # lista para reiniciar 
    posición <- posición[posición[,1] >= 10, ] # quitar juegos perdidos
    }
nrow(posición)/casos

Produjo el resultado 0.00021, sugiriendo que la simulación perdió $99979$ veces pero no logró perder $21$ veces. De esos $21$ casos, después de un millón de juegos, los bankrolls sobrevivientes estaban en el rango de $68183$ a $17492689$ en esta simulación en particular, por lo que hubo una ganancia neta promedio.

Obviamente hay incertidumbre asociada con cualquier simulación y puede haber más pérdidas a medida que aumenta la cantidad de juegos, pero esto sugiere que la probabilidad de no perder en general es extremadamente baja. Alrededor del $82\%$ de las pérdidas parecían haber ocurrido en los primeros veinte juegos y alrededor del $97\%$ de las pérdidas en los primeros cien juegos, así que las ganancias potenciales ilimitadas no suelen compensar el costo de jugar juegos repetidos.

1voto

Markus Scheuer Puntos 16133

Nota: El siguiente argumento hace plausible que la probabilidad de perder el juego tienda a cero a largo plazo.

Mostramos que este comportamiento es válido independientemente del costo de un juego, siempre que sea constante y argumentamos que también es válido independientemente del capital inicial.

Introducción: El Paradoja de San Petersburgo es un juego famoso que trata sobre secuencias de arruinar apostadores. Un documento importante relacionado con este juego es _Nota sobre la ley de los grandes números y los juegos justos_ de W. Feller de $1937$.

Otro documento interesante, Sobre la resolución de Steinhaus de la Paradoja de San Petersburgo de S. Szörgö y G. Simmons, desarrolla las llamadas secuencias de Steinhaus. Estas secuencias, introducidas en $1949$ por Hugo Steinhaus, muestran con probabilidad $1$ la misma función de distribución empírica que las secuencias provenientes de la Paradoja de San Petersburgo.

Lo esencial de la paradoja es la no existencia de un valor de expectativa finito y la mayoría de los documentos abordan el problema de cómo podría el juego adoptarse para convertirlo en un juego justo.

Secuencias críticas: La pregunta de OP no se preocupa por estos aspectos. Aquí nos interesa solo la probabilidad de ganar el juego a largo plazo. Veamos una secuencia de caras y cruces

\begin{align*} HH\color{blue}{T}HHHH\color{blue}{T}\color{blue}{T}\color{blue}{T}H\color{blue}{T}H\color{blue}{T}\ldots\tag{1} \end{align*}

La secuencia en (1) comienza con los $6$ juegos consecutivos

\begin{align*} HH\color{blue}{T},HHH\color{blue}{T},\color{blue}{T},\color{blue}{T},H\color{blue}{T},H\color{blue}{T},\ldots \end{align*}

Siempre que la moneda muestra una cara ($H$), la ganancia se duplica hasta que ocurre la primera vez una cruz ($T$), finalizando esta instancia del juego. Si $c_0$ es el costo de cada instancia, obtenemos para

$$H^nT\qquad \text{una ganancia de} \qquad 2^{n}-c_0 \qquad\qquad n\geq 0$$

Veamos algunos aspectos característicos. Observamos que $c_0$ compensa aproximadamente $[\log_2(c_0)]$ ganancias. En el ejemplo de OP, $c_0=10$ y así cada vez que un juego es de la forma $T,HT,HHT$ or $HHHT$, es decir, un juego con no más de $[\log_2(c_0)]$ $H$'s, tenemos una pérdida (o ninguna ganancia en caso de que $c_0=2^k$). Llamemos a esas secuencias que disminuyen el puntaje actual secuencias críticas.

Observamos que una característica para determinar el resultado del juego es la distribución de secuencias críticas a largo plazo del juego.

Cuanto mayor sea el valor de $c_0$, más secuencias críticas son posibles dentro de un juego y la pregunta es si contribuyen en una cantidad considerable entre todas las trayectorias, de modo que la probabilidad de una pérdida a largo plazo sea mayor a cero.

También cabe señalar que por el momento no nos ocupamos del capital inicial $m_0$. En el ejemplo de OP, $m_0=100$, pero por el momento lo ignoraremos y asumimos que $m_0=0$.

Trayectorias de la retícula:

Podemos modelar el juego utilizando trayectorias de la retícula. Asociamos una trayectoria de la retícula a una secuencia de la forma (1) que consiste en pasos ascendentes $a$ por cada H en la dirección $(1,1)$ y pasos descendentes $b$ por cada T en la dirección $(1,-1)$.

Analizamos ahora las trayectorias de la retícula con respecto a las secuencias críticas.

Sea

$$SEQ(a)=\{\varepsilon,a,aa,aaa,\ldots\}$$

el conjunto de todas las trayectorias que contienen solo a's con longitud $\geq 0$. Una trayectoria con longitud cero se denota con $\varepsilon$. La función generatriz correspondiente es $$(az)^0+(az)^1+(az)^2+\ldots= \frac{1}{1-az},$$ con el exponente de $z^n$ marcando la longitud $n$ de una trayectoria de a's y el coeficiente de $(az)^n$ marcando el número de trayectorias de longitud $n$.

Sea $SEQ^{\geq k}(a)$ el conjunto de todas las trayectorias de a's con longitud $\geq k$. La función generatriz para $SEQ^{\geq k}(a)$ es $\frac{(az)^k}{1-az}$.

Ahora podemos describir las secuencias en (1) como todas aquellas trayectorias que pueden construirse como concatenación de una o más partes de la forma

$$SEQ(a)b=\{b,ab,aab,aaab,\ldots\}\qquad\longleftrightarrow\qquad G(z)=\frac{bz}{1-az}$$

Esto lleva a la descripción formal

$$SEQ^{\geq 1}(SEQ(a)b)$$ con la función generatriz

\begin{align*} H(z)&=\frac{G(z)}{1-G(z)}=\frac{\frac{bz}{1-az}}{1-\frac{bz}{1-az}} =\frac{bz}{1-(a+b)z}\\ \\ &=bz\sum_{n\geq 0}(a+b)^nz^n\\ &=\sum_{n\geq 0}\sum_{j=0}^n\binom{n}{j}a^jb^{n-j+1}z^{n+1}\tag{2} \end{align*}

Conclusión: En caso de que $c_0=10$, lo que significa que el costo de una instancia de un juego es $10$, las trayectorias críticas son $b,ab,aab$ y $aaab$. La distribución de estas trayectorias críticas dentro de todas las $2^n$ trayectorias de longitud $n+1$ y que terminan con $b$ es según (2) \begin{align*} \frac{\binom{n}{0}+\binom{n}{1}+\binom{n}{2}+\binom{n}{3}}{2^n}=\frac{P(n)}{2^n} \end{align*} con $P(n)$ un polinomio de grado $3$.

Observamos que a largo plazo para todos los valores $c_0$ el número de trayectorias críticas dentro de un juego de longitud $n$ se correlaciona con un polinomio $P(n)$ de grado $[\log_2(c_0)]$ y dado que \begin{align*} \lim_{n\rightarrow\infty}\frac{P(n)}{2^n}=0\tag{3} \end{align*} la probabilidad de perder el juego de San Petersburgo a largo plazo también parece tender a cero.

Nota:

  • El capital inicial $m_0$ presumiblemente solo tiene influencia con respecto a la longitud de los juegos. Cuanto mayor sea el capital inicial, mayor será la probabilidad de un juego más largo. Pero también parece que esto no tiene impacto en la probabilidad resultante al considerar las ganancias y pérdidas de todas las trayectorias de longitud $n$ con $n$ tendiendo a infinito. El aumento polinómico de las trayectorias críticas versus el aumento exponencial de todas las trayectorias siempre tenderá a una probabilidad de ganar de $1$ a largo plazo.

Nota: La notación y la descripción formal de las trayectorias corresponden a un ejemplo en I.1.4 en el libro de P. Flajolet y R. Sedgewicks Combinatoria Analítica

1voto

Scott McClung Puntos 171

Sea $P_n$ la probabilidad de perder (no tener suficiente dinero indefinidamente para jugar) si comienzas con $n$ dólares. Ahora, podemos observar que las probabilidades no cambian después de un paso, excepto que ahora se distribuyen en los posibles valores de $n$. Como tal, podemos expresar que, para $n\geq 10$, $$ P_n = \frac{P_{n-9}}2 + \frac{P_{n-8}}4 + \frac{P_{n-6}}8 + \cdots + \frac{P_{n-10+2^k}}{2^{k+1}} + \cdots $$ lo cual establece nuestro requisito de que el límite al infinito no cambie. También tenemos que $P_n=1$ para $n<10$.

Las investigaciones de este sistema utilizando Octave, al construir el sistema de matrices para esto, tomando $P_n=0$ para $n>n_{max}$ (esto crea un sistema de matriz de $(n_{max}-9)\times(n_{max}-9)$), producen un resultado interesante:

A medida que aumentamos $n_{max}$, $P_n$ aumenta para cada $n... de una manera que sugiere que están tendiendo a 1. Es decir, parece que, para cualquier $n$ finito, el resultado final será en realidad $P_n=1$, lo que significa que, dado el tiempo suficiente, el jugador se quedará sin dinero en algún momento. Por ejemplo, para $n_{max}=5009$, obtenemos $P_{100}\approx 0.9960939$. Para $n_{max}=10009$, obtenemos $P_{100}\approx 0.9977098$. Aquí están las curvas de probabilidad que resultan para $n_{max}$ = 2509, 5009 y 10009 (nota: la coordenada x está desplazada en 9, por lo que la primera curva va de 1 a 2500 en lugar de 10 a 2509):

Probabilidades P_n

Tenga en cuenta que estas muestran efectivamente la probabilidad de perder si el jugador tiene $n$ dólares al principio y la casa tiene $n_{max}-n$ dólares que pueden dar, es decir, si el jugador gana lo suficiente como para llegar a $n_{max}$, entonces ha limpiado el banco de la casa y ha "ganado", mientras que si el jugador cae por debajo de 10 dólares, ha "perdido". Recordatorio: el $P_n$ mostrado en el gráfico muestra la probabilidad de perder.

0voto

Jon Mark Perry Puntos 4480

Si juegas 8 partidas, esperas perder \$9 en 4, \$8 en 2 y \$6 en 1 con la última partida aún sin decidir. Por lo tanto, deberías esperar perder \$60. Si juegas otras 8 partidas, estarás -\$9 $* 8$, -\$8 $* 4$, -\$6 $* 2$ y perderás otros \$2, con una pequeña probabilidad de ganar \$2. Así que en total, estarías perdiendo \$116, y así se acaba el juego. Podrías ganar, pero la probabilidad de que ganes es solo $1/16$, por lo que por cada 16 intentos, estarías perdiendo aproximadamente \$116.

Puedes pensar que podrías ganar fácilmente \$1014, pero te tomaría aproximadamente 2048 intentos, lo que te costaría \$20480.

Una vez escribí un juego similar, pero en este los odds son iguales: http://demonstrations.wolfram.com/GameOfDice/

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X