Nota: El siguiente argumento hace plausible que la probabilidad de perder el juego tienda a cero a largo plazo.
Mostramos que este comportamiento es válido independientemente del costo de un juego, siempre que sea constante y argumentamos que también es válido independientemente del capital inicial.
Introducción: El Paradoja de San Petersburgo es un juego famoso que trata sobre secuencias de arruinar apostadores. Un documento importante relacionado con este juego es _Nota sobre la ley de los grandes números y los juegos justos_ de W. Feller de $1937$.
Otro documento interesante, Sobre la resolución de Steinhaus de la Paradoja de San Petersburgo de S. Szörgö y G. Simmons, desarrolla las llamadas secuencias de Steinhaus. Estas secuencias, introducidas en $1949$ por Hugo Steinhaus, muestran con probabilidad $1$ la misma función de distribución empírica que las secuencias provenientes de la Paradoja de San Petersburgo.
Lo esencial de la paradoja es la no existencia de un valor de expectativa finito y la mayoría de los documentos abordan el problema de cómo podría el juego adoptarse para convertirlo en un juego justo.
Secuencias críticas: La pregunta de OP no se preocupa por estos aspectos. Aquí nos interesa solo la probabilidad de ganar el juego a largo plazo. Veamos una secuencia de caras y cruces
\begin{align*} HH\color{blue}{T}HHHH\color{blue}{T}\color{blue}{T}\color{blue}{T}H\color{blue}{T}H\color{blue}{T}\ldots\tag{1} \end{align*}
La secuencia en (1) comienza con los $6$ juegos consecutivos
\begin{align*} HH\color{blue}{T},HHH\color{blue}{T},\color{blue}{T},\color{blue}{T},H\color{blue}{T},H\color{blue}{T},\ldots \end{align*}
Siempre que la moneda muestra una cara ($H$), la ganancia se duplica hasta que ocurre la primera vez una cruz ($T$), finalizando esta instancia del juego. Si $c_0$ es el costo de cada instancia, obtenemos para
$$H^nT\qquad \text{una ganancia de} \qquad 2^{n}-c_0 \qquad\qquad n\geq 0$$
Veamos algunos aspectos característicos. Observamos que $c_0$ compensa aproximadamente $[\log_2(c_0)]$ ganancias. En el ejemplo de OP, $c_0=10$ y así cada vez que un juego es de la forma $T,HT,HHT$ or $HHHT$, es decir, un juego con no más de $[\log_2(c_0)]$ $H$'s, tenemos una pérdida (o ninguna ganancia en caso de que $c_0=2^k$). Llamemos a esas secuencias que disminuyen el puntaje actual secuencias críticas.
Observamos que una característica para determinar el resultado del juego es la distribución de secuencias críticas a largo plazo del juego.
Cuanto mayor sea el valor de $c_0$, más secuencias críticas son posibles dentro de un juego y la pregunta es si contribuyen en una cantidad considerable entre todas las trayectorias, de modo que la probabilidad de una pérdida a largo plazo sea mayor a cero.
También cabe señalar que por el momento no nos ocupamos del capital inicial $m_0$. En el ejemplo de OP, $m_0=100$, pero por el momento lo ignoraremos y asumimos que $m_0=0$.
Trayectorias de la retícula:
Podemos modelar el juego utilizando trayectorias de la retícula. Asociamos una trayectoria de la retícula a una secuencia de la forma (1) que consiste en pasos ascendentes $a$ por cada H en la dirección $(1,1)$ y pasos descendentes $b$ por cada T en la dirección $(1,-1)$.
Analizamos ahora las trayectorias de la retícula con respecto a las secuencias críticas.
Sea
$$SEQ(a)=\{\varepsilon,a,aa,aaa,\ldots\}$$
el conjunto de todas las trayectorias que contienen solo a's con longitud $\geq 0$. Una trayectoria con longitud cero se denota con $\varepsilon$. La función generatriz correspondiente es $$(az)^0+(az)^1+(az)^2+\ldots= \frac{1}{1-az},$$ con el exponente de $z^n$ marcando la longitud $n$ de una trayectoria de a's y el coeficiente de $(az)^n$ marcando el número de trayectorias de longitud $n$.
Sea $SEQ^{\geq k}(a)$ el conjunto de todas las trayectorias de a's con longitud $\geq k$. La función generatriz para $SEQ^{\geq k}(a)$ es $\frac{(az)^k}{1-az}$.
Ahora podemos describir las secuencias en (1) como todas aquellas trayectorias que pueden construirse como concatenación de una o más partes de la forma
$$SEQ(a)b=\{b,ab,aab,aaab,\ldots\}\qquad\longleftrightarrow\qquad G(z)=\frac{bz}{1-az}$$
Esto lleva a la descripción formal
$$SEQ^{\geq 1}(SEQ(a)b)$$ con la función generatriz
\begin{align*} H(z)&=\frac{G(z)}{1-G(z)}=\frac{\frac{bz}{1-az}}{1-\frac{bz}{1-az}} =\frac{bz}{1-(a+b)z}\\ \\ &=bz\sum_{n\geq 0}(a+b)^nz^n\\ &=\sum_{n\geq 0}\sum_{j=0}^n\binom{n}{j}a^jb^{n-j+1}z^{n+1}\tag{2} \end{align*}
Conclusión: En caso de que $c_0=10$, lo que significa que el costo de una instancia de un juego es $10$, las trayectorias críticas son $b,ab,aab$ y $aaab$. La distribución de estas trayectorias críticas dentro de todas las $2^n$ trayectorias de longitud $n+1$ y que terminan con $b$ es según (2) \begin{align*} \frac{\binom{n}{0}+\binom{n}{1}+\binom{n}{2}+\binom{n}{3}}{2^n}=\frac{P(n)}{2^n} \end{align*} con $P(n)$ un polinomio de grado $3$.
Observamos que a largo plazo para todos los valores $c_0$ el número de trayectorias críticas dentro de un juego de longitud $n$ se correlaciona con un polinomio $P(n)$ de grado $[\log_2(c_0)]$ y dado que \begin{align*} \lim_{n\rightarrow\infty}\frac{P(n)}{2^n}=0\tag{3} \end{align*} la probabilidad de perder el juego de San Petersburgo a largo plazo también parece tender a cero.
Nota:
- El capital inicial $m_0$ presumiblemente solo tiene influencia con respecto a la longitud de los juegos. Cuanto mayor sea el capital inicial, mayor será la probabilidad de un juego más largo. Pero también parece que esto no tiene impacto en la probabilidad resultante al considerar las ganancias y pérdidas de todas las trayectorias de longitud $n$ con $n$ tendiendo a infinito. El aumento polinómico de las trayectorias críticas versus el aumento exponencial de todas las trayectorias siempre tenderá a una probabilidad de ganar de $1$ a largo plazo.
Nota: La notación y la descripción formal de las trayectorias corresponden a un ejemplo en I.1.4 en el libro de P. Flajolet y R. Sedgewicks Combinatoria Analítica