3 votos

Un juego de dados injusto.

Las tres caras son A, B y C. Nos dan tres tiradas libres. En cualquier tirada libre si obtenemos A o B, las tiradas libres se reinician a 3 y tres C consecutivas significan fin del juego. Si obtenemos un total de 10 A el juego termina. Cada B paga $1*(el número total de A's encontradas hasta ese momento).

Necesito determinar el número medio de tiradas gratuitas y el pago medio.

He intentado modelarlo como una cadena de Markov.

2voto

user326210 Puntos 26

Una forma clave de simplificar esta pregunta es preguntar: "¿Cuántas B espero ver antes de ver una A y antes de ver tres C consecutivas?". Se trata de un minijuego cuya respuesta es útil para resolver el puzzle general.

Puede subdividir el rompecabezas general en fases en función del número de A que hayas visto hasta el momento (A=0, A=1, A=2, etc.). En cada fase, juegas y cuentas el número de B que ves hasta que pierdes o ves otra A y pasas a la siguiente fase. El número de B que veas no depende de la fase en la que te encuentres.

Como se muestra a continuación, puede calcular este factor $E$ (el número esperado de B antes de ver una A o tres C consecutivas) y $P$ (la probabilidad de que el minijuego termine viendo una A en lugar de ver tres C consecutivas), en cuyo caso el pago esperado puede expresarse como: $$T = E \left[0 + P + 2P^2 + 3P^3 + \ldots + 9P^9\right]$$

Y con un truco similar, si $\ell$ es el número esperado de tiradas de dados en una fase dada, entonces el número esperado de tiradas de dados es:

$$L = \ell \left[1 + P + P^2 + P^3 + \ldots + P^9\right]$$


  • Sea $\alpha, \beta, \gamma$ denotan las probabilidades de sacar una A, una B y una C respectivamente. Si te quedan tres tiradas, al lanzar el dado podrías obtener:

    • Una A, con probabilidad $\alpha$ . No obtienes ninguna B y el minijuego termina.
    • A B, con probabilidad $\beta$ . Obtienes una B, y vuelves al estado original (tres lanzamientos restantes, sin C consecutivas).
    • Un cierto número de "C" seguidas. Con probabilidad $\gamma^3$ ves tres seguidas y pierdes. Con probabilidad $\gamma^2 \alpha$ ves dos C seguidas de una A, y el minijuego termina. Con probabilidad $\gamma^2\beta$ se ven dos C seguidas de una B y se vuelve al estado original. Con probabilidad $\gamma \alpha$ el juego termina. Con probabilidad $\gamma\beta$ se ve una C y una B y se vuelve al estado original.
    • Estas son todas las posibilidades.
  • En general, si $E$ denota el número esperado de B vistas, los casos anteriores dan la fórmula de la expectativa:

    $$E = (\gamma^3 + \gamma^2\alpha + \gamma \alpha + \alpha)\cdot 0 + (\gamma^2\beta + \gamma\beta + \beta) \cdot (1+E)$$ $$E = (1+\gamma +\gamma^2)\beta + (1+\gamma + \gamma^2)\beta E$$ $$E = \frac{\beta(1+\gamma + \gamma^2)}{1-\beta(1+\gamma+\gamma^2)}$$

  • También necesitamos la probabilidad de que ese minijuego termine viendo una A, en lugar de ver tres C consecutivas. Por una fórmula similar, esta probabilidad es:

    $$P = \alpha (1 + \gamma + \gamma^2) + \beta(1 + \gamma + \gamma^2) P + 0 \cdot \gamma^3 $$ $$P = \frac{\alpha (1+\gamma+\gamma^2)}{1-\beta(1+\gamma+\gamma^2)}$$

  • Ahora podemos resolver el problema del coste global esperado.

    • Si ha visto $m$ A hasta ahora, el número esperado de B hasta que veas la siguiente A (o pierdas la partida) es $E$ (como se ha calculado anteriormente). El pago esperado en ese caso es $mE$ . Entonces, con probabilidad $P$ continúa el juego con $m+1$ A vistas hasta ahora, de lo contrario has visto 3 C seguidas y has perdido.

    • Cuando el juego termina después de ver 10 A's, el pago total esperado $T$ es por lo tanto:

    $$T = E \left[P + 2P^2 + 3P^3 + \ldots + 9P^9\right]$$

  • Podemos resolver el problema de la longitud esperada (número esperado de lanzamientos) utilizando el mismo planteamiento; si $\ell$ denota el número esperado de dados lanzados antes de ver una A o tres C consecutivas, entonces según mis matemáticas:

    $$\ell = \gamma^3(3) + \gamma^2\alpha(3) + \gamma\alpha(2) + \alpha(1) + \gamma^2\beta(3+\ell) + \gamma\beta(2+\ell) + \beta(1+\ell)$$

    $$\ell = 3\gamma^3 + \left[3\gamma^2 + 2\gamma + 1\right](\alpha+\beta) + \left[ \gamma^2 +\gamma + 1 \right]\beta \ell $$

    $$\ell = \frac{3\gamma^3 + (3\gamma^2 + 2\gamma + 1)(1-\gamma)}{1-(\gamma^2 +\gamma + 1)\beta}$$ Entonces podemos determinar el número esperado de dados $L$ lanzada durante el en general juego, utilizando la cantidad $P$ calculado arriba:

    $$L = \ell (1 + P + P^2 + P^3 + \ldots + P^9)$$

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X