4 votos

valor esperado de un juego con un dado de n caras

Supongamos que tenemos un dado de n caras. Cuando lo lanzamos, nos pueden pagar el resultado o podemos elegir volver a lanzarlo pagando $1/n$ . ¿Cuál es la mejor estrategia y cuál es el valor esperado de este juego?

Como aproximación, pensé que para obtener el valor máximo $n$ necesitamos rodar $n$ veces. Así que la mejor estrategia es tirar hasta que obtengamos el valor máximo $n$ y el valor esperado debería ser $n-1$ . ¿Es correcta como aproximación? ¿Cómo podemos calcular la mejor estrategia exacta y el valor esperado exacto?

0 votos

@ArthurSkirvin Ahh, pero ya estás pagando por 2 tiradas, así que en realidad estás en $3 - \frac{2}{6}$ así que la expectativa dice que ruede de nuevo (para un d6, claro).

0 votos

@Zimul8r Tienes razón por supuesto, error mío. No sé muy bien cómo se me ocurrió. Intentaba rebatir un comentario ya borrado que sugería que la estrategia óptima era jugar hasta conseguir 4 o más y me lié de alguna manera. Gracias por la corrección.

2voto

Arthur Skirvin Puntos 502

Creo que tu estrategia de esperar a sacar el valor máximo es óptima.

Digamos que has sacado un valor de $k_i$ en rollo $i$ para una puntuación total de $k_i-\frac{i-1}n$ . Si puedes superar tu tirada de $k_i$ en $n-1$ rollos acabarás superando también tu puntuación. Para demostrarlo tomemos el peor de los casos y digamos que te lleva $n-1$ más rollos que batir $k_i$ y que sólo le ganes por uno para que $k_{i+n-1}=k_i+1$ . Su puntuación sería entonces

$$k_{i+n-1}-\frac{i+n-2}n=k_i+1-\frac{i+n-2}n=k_i+\frac{2-i}n\gt k_i-\frac{i-1}n.$$

Entonces, si la probabilidad de superar tu tirada de $k_i$ en $n-1$ más tiradas (batiendo así tu puntuación) es superior a 0,5 deberías ir a por ello. La probabilidad de hacerlo mejor que $k_i$ en tu próxima tirada es $1-\frac{k_i}n$ por lo que la probabilidad de que el primero lo haga mejor que $k_i$ en su $m$ El siguiente rodillo se distribuye geométricamente:

$$p_M(m)=\left(\frac{k_i}n\right)^{m-1}\left(1-\frac{k_i}n\right)$$

Lo que significa que la probabilidad de hacerlo mejor que $k_i$ en $n-1$ más rollos es $$\sum_{j=1}^{n-1}p_M(j)=\left(1-\frac{k_i}n\right)\left(\left(\frac{k_i}n\right)^{0}+\left(\frac{k_i}n\right)^{1}+...+\left(\frac{k_i}n\right)^{n-2}\right)=1-\left(\frac{k_i}n\right)^{n-1}$$ Así que aunque $k_i=n-1$ tenemos que la probabilidad de mejorar su puntuación dentro de $n-1$ más rollos es $$1-\left(\frac{n-1}n\right)^{n-1}$$

Que aumenta a medida que $n$ aumenta. Si $n=2$ esto sería $0.5$ por lo que para cualquier $n \gt 2$ la probabilidad de mejorar su puntuación en $n-1$ más tiradas aunque hayas sacado una $n-1$ es mayor que 0,5, así que deberías hacerlo. Por lo tanto, si no ha tirado un $n$ siempre es mejor seguir hasta conseguirlo.

Dado que el número esperado de tiradas para obtener $n$ es $n$ la puntuación esperada con esta estrategia es $n-\frac{n-1}n$ .

0voto

Zimul8r Puntos 620

Nota: Resulta que esto no es lo óptimo. Mi estrategia depende de mirar la probabilidad de batir tu puntuación actual con la siguiente tirada. En su respuesta, @ArthurSkirvin se fija en la probabilidad de superarla en cualquier tirada posterior. Como era de esperar, la estrategia a largo plazo es mejor.

(Estoy asumiendo un número par de caras del dado, por lo que hay un $\frac{n}{2}$ lado más alto menos que el del dado $\frac{n+1}{2}$ media).

Pruebas: Si tiras $\ \frac{n}{2}$ o menos en su $i+1^{st}$ rollo y se detuvo, usted tiene a lo sumo $\ \frac{n}{2}-\frac{i}{n}$ mientras que el valor esperado de una nueva tirada (menos el coste total) es $\ \frac{n}{2}+\frac{1}{2}-\frac{i+1}{n}$ lo que supone una ganancia esperada de $\frac{1}{2}-\frac{1}{n}$ que es $>0$ para cualquier cosa mayor que un dado de 2 caras, así que deberías volver a tirar. (Pero modifica la estrategia si lanzas monedas).

Si has rodado $\ \frac{n}{2}+1$ o superior en su $i+1^{st}$ rollo, tienes al menos $\ \frac{n}{2}+1-\frac{i}{n}$ mientras que el valor esperado de una nueva tirada (menos el coste total) sigue siendo $\ \frac{n}{2}+\frac{1}{2}-\frac{i+1}{n}$ lo que le da un pérdida de $\frac{1}{2}+\frac{1}{n}$ que es $>0$ así que deberías parar.

Para calcular el valor esperado de la estrategia, $\frac{1}{2}$ la vez que sacas más que la media en la primera tirada y te detienes. Dado que has sacado en la mitad superior del dado, tendrás una media de $\ \frac{3n+2}{4}$ . La otra mitad la vuelves a tirar.

La mitad de esas veces, (ahora $\frac{1}{4}$ de la probabilidad total), sacas una tirada superior a la media y te detienes, ganando esta vez $\ \frac{3n+2}{4}-\frac{1}{n}$ para pagar la nueva tirada.

La siguiente, estás en $\frac{1}{8}$ de la probabilidad total, y se para con $\ \frac{3n+2}{4}-\frac{2}{n}$ o volver a tirar, y así sucesivamente.

Así que el resultado esperado es el siguiente

$\sum_{i=0}^{\infty} (\frac{3n+2}{4}- \frac{i}{n})(\frac{1}{2})^{i+1}$

Para un dado de 6 caras, eso es $4\frac{5}{6}$ .

0 votos

El valor esperado de la estrategia de la pregunta original (jugar hasta sacar el máximo) parece tener un valor esperado mayor que $4\frac56$ para un d6. Sin embargo, tal vez me estoy perdiendo algo de nuevo. ¿Podría explicarlo?

0 votos

No, parece que has dado en el clavo. Mi estrategia depende de la probabilidad de superar tu puntuación actual con la siguiente tirada. La tuya mira la probabilidad de superarla en cualquier tirada posterior. Como era de esperar, la estrategia a largo plazo es mejor.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X