4 votos

Juego de probabilidades con dados

Estamos jugando a un juego en mi clase de AP Stats llamado Greed. Para jugar, todo el mundo se pone de pie y el profesor tira los dados. Si en la primera ronda sale un número distinto de 5, se obtienen 100 puntos. Los alumnos tienen la opción de acumular sus puntos sentándose (no se les permite volver a levantarse y seguir jugando después de haber acumulado sus puntos), o pueden seguir jugando para ganar más puntos. Se vuelve a tirar el dado en la segunda ronda y, si sale cualquier número que no sea un 5, se obtienen 200 puntos más (tercera ronda: 300 puntos, cuarta ronda: 400 puntos, etc.). Sin embargo, si sale un 5 y eliges quedarte parado, pierdes todos los puntos que hayas ganado ese día. Jugamos una partida cada día (una partida es cuando seguimos tirando hasta que sale un 5 o hasta que todo el mundo está sentado). Mi profesor dice que hay una estrategia en este juego, que a la larga los resultados son predecibles. ¿Cuál es la estrategia? ¿Cómo puedo ganar más puntos al final del semestre? ¿Después de qué tirada debo sentarme?

1 votos

Necesidad de añadir la etiqueta de autoaprendizaje.

0 votos

¿Cuántos dados se tiran? ¿Supongo que sólo uno porque no has dado explícitamente un número? Estaría bien aclararlo.

4voto

AdamSane Puntos 1825

Esbozaré algunas cosas pero evitaré una solución explícita. La cuestión es que intentes resolverlo.

En cada paso, tendrás una cierta cantidad de puntos, $M$ . Si te presentas a la siguiente tirada ganarás $k$ más puntos (dándole $M+k$ ) o perderá $M$ (dejándote con $0$ ).

La estrategia de maximización del valor esperado diría que cada vez que un $5/6$ posibilidad de $k$ vale más que un $1/6$ posibilidad de $M$ -- es decir, cuando la ganancia esperada de jugar otra ronda sería positiva, se beneficia (por término medio) de continuar. Un poco de aritmética mental te permite ver cuándo sentarte en una variedad de juegos similares de este tipo (siempre y cuando no sea un juego que se vuelva mucho, mucho más rentable más tarde, no hay necesidad de sumar series, puedes quedarte parado hasta que la ganancia neta en la siguiente tirada ya no sea positiva).

Imagina, por ejemplo, que juegas la primera ronda y obtienes $100 $ puntos. Ahora en la segunda ronda obtendrías $200$ puntos si gana ( $5/6$ oportunidad) y perder $100$ puntos si tienes un $5$ ( $1/6$ oportunidad). La ganancia esperada es $200\times 5/6$ y la pérdida esperada es $100 \times 1/6$ para una rentabilidad esperada de $900/6 = 150$ Por término medio, puede ganar mucho más que perder.

Sin embargo Si estás tratando de ser la persona con más puntos de todos al final de muchas de esas partidas de Avaricia, maximizar el valor esperado en cada turno es no ¡la estrategia óptima para ser el ganador final!

Dependiendo de la posición en la que se encuentre en relación con otros jugadores, puede que le convenga arriesgarse menos para obtener mayores beneficios o apostar por ganancias menores y más seguras.

Imagina que vas segundo pero la persona que va primera te lleva bastante ventaja. Si te sientas en el punto que maximizaría tu rendimiento esperado para esa única ronda, puede que simplemente te asegures de no ganar. Del mismo modo, si va muy por delante en la última ronda, será mejor que se siente mucho antes de lo que maximizaría su rendimiento esperado en esa ronda, ya que podría estar arriesgando innecesariamente una victoria casi segura si continúa.

Si estuvieras jugando muchas más rondas buscarías (aproximadamente) maximizar el valor esperado por turno, pero a medida que te acercas a las últimas rondas la estrategia ganadora cambia: si vas por detrás, debes arriesgar más, si vas por delante, menos. Cuando te acercas al final, no es sólo la ronda actual de puntos lo que importa si quieres maximizar la posibilidad de estar por delante al final.

Puedes calcular la estrategia exacta matemáticamente, pero creo que el profesor está intentando que lleves a cabo la tarea más sencilla de maximizar tus ganancias esperadas (que funciona bastante bien en las fases iniciales y medias del juego iterado).

Tal vez quieras consultar los artículos sobre estrategia para el juego de dados Cerdo (de la que ésta es una variante). Hay mucha información en Internet sobre la estrategia de las distintas versiones de este juego, pero es más divertido resolverlo en detalle uno mismo. Aquí es un documento que también señala que la estrategia de maximización de expectativas no es óptima. Tu juego es un poco diferente (tu recompensa aumenta y todos obtienen las mismas tiradas) pero las ideas básicas son las mismas.

0 votos

"no hace falta sumar series", ¿cómo encontrarás entonces tu M actual?

1 votos

Espero que la gente sea consciente de su total actual de forma incremental (" Tenía 600 puntos y acabo de conseguir otros 400, así que son 1000. "). La cuestión no era que no hubiera necesidad de llevar la cuenta de cuántos puntos tienen ahora mismo, sino que no hay necesidad de saber cuál es el fórmula para $\sum_{i=1}^N i$ ni manipularlo algebraicamente para poder averiguar cuándo el valor esperado de la siguiente tirada deja de ser positivo.

1voto

Tilefish Poele Puntos 140

En la n-ésima tirada tienes un $1/6$ -ésima oportunidad de perder la suma aritmética de $1$ a $n-1$ de puntos, o un $5/6$ -ésima oportunidad de ganar $n$ puntos. Por lo tanto, existe claramente un punto de inflexión cuando el valor esperado de la suma es mayor que el valor esperado de $n$ (ya que la suma aritmética es cuadrática en $n$ ) por lo que tu ganancia esperada para esa tirada es negativa, así que detente en este punto. Como se trata de un juego para una clase de estadística, supongo que el profesor quiere que lo resuelvas, así que te dejaré el resto a ti, pero esa es la idea.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X