4 votos

Dos jugadores y dos monedas

Dos jugadores están jugando un juego. El primer jugador tiene monedas de oro ilimitadas de 2 tipos, $C_1=2\$$ and $C_2=5\$$. Each turn he chooses one of these coins and hides it in his hand. If the second player guesses correctly which type of coin the first player is hiding in his hand, he gets this coin; otherwise he loses $x$ cents. Find the largest integer $x$ para que el juego es beneficioso para el segundo jugador.

Yo sabía la respuesta, pero se me olvida cómo hemos llegado. Agradeceria si alguien sería explicar para mí. Gracias.

Respuesta es x = 316

5voto

user30357 Puntos 6

Desde que el primer jugador tiene un número ilimitado de monedas que no te debe importar cuánto dinero se pierde y no hay ninguna predicción sobre su estrategia posible. Pero sólo permite suponer que él quiere perder tan poco dinero como sea posible.

Deje que el jugador 1 elige la moneda $C_1$ con una probabilidad de $p$ y dejar que el jugador 2 elige la moneda $C_1$ con una probabilidad de $q$.

Entonces el valor esperado para el jugador 2 es $$2pq+5(1-p)(1-q)-(1-pq-(1-p)(1-q))x$$ $$=7pq-5p-5q+5-x(p+q-2pq)$$

El jugador 2 quiere maximizar su beneficio dependiendo el primer jugador de la estrategia. De forma que podamos obtener wrt $q$:

$$7p-5-x(1-2p)$$

Si el dervative es positivo, el jugador 2 elige $q$ maximal, es decir, $q=1$ a las ganancias en $2p-x(1-p)$, si es negativo, el jugador 2 elige $q$ mínima decir $q=0$ a las ganancias en $5-5p-xp$, y si es cero, su elección no importa y para todos los que vale la pena, podemos suponer que él toma $q=0$.

Así que el jugador 1 quiere minimizar el máximo de $2p-x+px$$5-5p-xp$. Ya que uno es la disminución de la función de $p$ y la otra es aumentar el equilibrio es el punto en que son iguales:

$$2p-x+px=5-5p-xp\Leftrightarrow p=\frac{5+x}{7+2x}$$

La ganancia del jugador 2 es

$$(2+x)\frac{5+x}{7+2x}-x$$

Esto es positivo si y sólo si $x\leq \sqrt{10}\simeq 3.16$

Editar supongo que podría ser capaz de agilizar la solución de un poco ya que esta $x$ es, precisamente, el valor para el cual la derivada anterior se desvanece. Sospecho que esto no es una coincidencia. Por desgracia, no tengo idea de la teoría general y basado en mi solución únicamente en el sentido común.

0voto

lowglider Puntos 562

Este es un juego de suma cero, por lo que la solución se reduce a encontrar el minimax estrategias para los dos jugadores, el cálculo de su expectativa de recompensas para aquellos estrategias y encontrar el valor de umbral de $x$ para que el beneficio esperado para cada jugador es igual a cero.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X