Una forma clave de simplificar esta pregunta es preguntar: "¿Cuántas B espero ver antes de ver una A y antes de ver tres C consecutivas?". Se trata de un minijuego cuya respuesta es útil para resolver el puzzle general.
Puede subdividir el rompecabezas general en fases en función del número de A que hayas visto hasta el momento (A=0, A=1, A=2, etc.). En cada fase, juegas y cuentas el número de B que ves hasta que pierdes o ves otra A y pasas a la siguiente fase. El número de B que veas no depende de la fase en la que te encuentres.
Como se muestra a continuación, puede calcular este factor $E$ (el número esperado de B antes de ver una A o tres C consecutivas) y $P$ (la probabilidad de que el minijuego termine viendo una A en lugar de ver tres C consecutivas), en cuyo caso el pago esperado puede expresarse como: $$T = E \left[0 + P + 2P^2 + 3P^3 + \ldots + 9P^9\right]$$
Y con un truco similar, si $\ell$ es el número esperado de tiradas de dados en una fase dada, entonces el número esperado de tiradas de dados es:
$$L = \ell \left[1 + P + P^2 + P^3 + \ldots + P^9\right]$$
-
Sea $\alpha, \beta, \gamma$ denotan las probabilidades de sacar una A, una B y una C respectivamente. Si te quedan tres tiradas, al lanzar el dado podrías obtener:
- Una A, con probabilidad $\alpha$ . No obtienes ninguna B y el minijuego termina.
- A B, con probabilidad $\beta$ . Obtienes una B, y vuelves al estado original (tres lanzamientos restantes, sin C consecutivas).
- Un cierto número de "C" seguidas. Con probabilidad $\gamma^3$ ves tres seguidas y pierdes. Con probabilidad $\gamma^2 \alpha$ ves dos C seguidas de una A, y el minijuego termina. Con probabilidad $\gamma^2\beta$ se ven dos C seguidas de una B y se vuelve al estado original. Con probabilidad $\gamma \alpha$ el juego termina. Con probabilidad $\gamma\beta$ se ve una C y una B y se vuelve al estado original.
- Estas son todas las posibilidades.
-
En general, si $E$ denota el número esperado de B vistas, los casos anteriores dan la fórmula de la expectativa:
$$E = (\gamma^3 + \gamma^2\alpha + \gamma \alpha + \alpha)\cdot 0 + (\gamma^2\beta + \gamma\beta + \beta) \cdot (1+E)$$ $$E = (1+\gamma +\gamma^2)\beta + (1+\gamma + \gamma^2)\beta E$$ $$E = \frac{\beta(1+\gamma + \gamma^2)}{1-\beta(1+\gamma+\gamma^2)}$$
-
También necesitamos la probabilidad de que ese minijuego termine viendo una A, en lugar de ver tres C consecutivas. Por una fórmula similar, esta probabilidad es:
$$P = \alpha (1 + \gamma + \gamma^2) + \beta(1 + \gamma + \gamma^2) P + 0 \cdot \gamma^3 $$ $$P = \frac{\alpha (1+\gamma+\gamma^2)}{1-\beta(1+\gamma+\gamma^2)}$$
-
Ahora podemos resolver el problema del coste global esperado.
-
Si ha visto $m$ A hasta ahora, el número esperado de B hasta que veas la siguiente A (o pierdas la partida) es $E$ (como se ha calculado anteriormente). El pago esperado en ese caso es $mE$ . Entonces, con probabilidad $P$ continúa el juego con $m+1$ A vistas hasta ahora, de lo contrario has visto 3 C seguidas y has perdido.
-
Cuando el juego termina después de ver 10 A's, el pago total esperado $T$ es por lo tanto:
$$T = E \left[P + 2P^2 + 3P^3 + \ldots + 9P^9\right]$$
-
Podemos resolver el problema de la longitud esperada (número esperado de lanzamientos) utilizando el mismo planteamiento; si $\ell$ denota el número esperado de dados lanzados antes de ver una A o tres C consecutivas, entonces según mis matemáticas:
$$\ell = \gamma^3(3) + \gamma^2\alpha(3) + \gamma\alpha(2) + \alpha(1) + \gamma^2\beta(3+\ell) + \gamma\beta(2+\ell) + \beta(1+\ell)$$
$$\ell = 3\gamma^3 + \left[3\gamma^2 + 2\gamma + 1\right](\alpha+\beta) + \left[ \gamma^2 +\gamma + 1 \right]\beta \ell $$
$$\ell = \frac{3\gamma^3 + (3\gamma^2 + 2\gamma + 1)(1-\gamma)}{1-(\gamma^2 +\gamma + 1)\beta}$$ Entonces podemos determinar el número esperado de dados $L$ lanzada durante el en general juego, utilizando la cantidad $P$ calculado arriba:
$$L = \ell (1 + P + P^2 + P^3 + \ldots + P^9)$$