11 votos

Valor esperado del juego de dado de 100 caras

La siguiente pregunta es de una entrevista de la calle Jane.

Le dan un dado de 100 caras. Después saca una vez, usted puede elegir a cualquiera se les paga el monto de ese rollo o pagar un dólar por un rollo más. ¿Cuál es el valor esperado del juego? (No hay ningún límite en el número de rollos).

P.d.: creo que la pregunta se supone que somos racionales.

21voto

Terry Phan Puntos 36

Deje $v$ denotar el valor esperado del juego. Si sacas algo de $x\in\{1,\ldots,100\}$, usted tiene dos opciones:

  • Mantener el $x$ dólares.
  • Pagar el \$$1$ continuación tarifa y girar los dados una vez más. El valor esperado de la próxima tirada es $v$. Por lo tanto, la red espera que el valor de esta opción resulta ser $v-1$ dólares.

Elige una de estas dos opciones basadas en lo que le proporciona una mayor ganancia. Por lo tanto, si usted girado $x$, su rentabilidad es $\max\{x,v-1\}$.

Ahora, el valor esperado del juego, $v$, es determinado como el valor esperado de estos premios: \begin{align*} v=\frac{1}{100}\sum_{x=1}^{100}\max\{x,v-1\}, \end{align*} desde cada una de las $x$ tiene una probabilidad de $1/100$ y se le da un rollo de $x$, su rentabilidad es exactamente $\max\{x,v-1\}$. Esta ecuación no es sencillo de resolver. Del lado derecho se resume los $x$ valores por los que $x>v-1$, y para todos los valores de $x$ que $x\leq v-1$, agregar $v-1$ a la suma. Este par de sumatorias da $v$. El problema es que no sé donde para separar las dos sumatorias, ya que el valor de umbral basado en el $v-1$ es exactamente lo que usted necesita para calcular. Este valor de umbral se puede adivinar el uso de un cálculo numérico, basado en el que uno puede confirmar el valor de $v$ rigurosamente. Este resulta ser $v=87\frac{5}{14}$.

Por cierto, esta solución también revela que usted debe mantener rodar los dados para un cargo de $1 mientras que el rollo de 86 o menos, y aceptar cualquier cantidad 87 o más.

8voto

Sinar K.K Puntos 14

El valor esperado $G$ del juego es $87\frac{5}{14}\approx 87.357....$. Para una prueba de que usted puede considerar las siguientes recurrencia $$ G = \frac{101-b}{100} \frac{\frac{1}{2} 100 \times 101 - \frac{1}{2} b (b-1)}{101-b} + \frac{b-1}{100}(G-1) $$ con un fijo $b\in\{1,\ldots,100\}$ que es el valor que quieres lanzar al menos para detener el juego. La solución de la recurrencia de $G$ rendimientos $$ G = \frac{b^2+b-10.102}{2(b-101)} $$ y la diferenciación con respecto a $b$ rendimientos $$ \frac{d}{d, b}G =\frac{1}{2}-\frac{100} {b-101)^2} $$ con raíces $$ b=101\10 pm\sqrt{2}. $$ Sólo el samller raíz está en el intervalo deseado y el rendimiento máximo. Enchufe $86=\lfloor b\rfloor$ $87=\lceil b\rceil$ a $G$ y aprovechar al máximo para obtener el resultado.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X