1 votos

Expectativa y estrategia óptima

Estoy tratando de resolver este problema de abajo, pero estoy teniendo algunas dificultades.

El jugador A elige un número entero al azar entre 1 y 100, con probabilidad $p_j$ de elegir $j$ (para $j = 1, 2, \ldots , 100$ ). El jugador B adivina el número que eligió el jugador A, y recibe del jugador A esa cantidad en dólares si la adivinación es correcta (y $0$ en caso contrario).

(a) Supongamos para esta parte que el jugador $B$ conoce los valores de $p_j$ . ¿Qué es el jugador $B$ ¿la estrategia óptima de la empresa (para maximizar los beneficios esperados)?

(b) Demuestre que si ambos jugadores eligen sus números de forma que la probabilidad de elegir $j$ es proporcional a $1/j$ Entonces ninguno de los jugadores tiene incentivos para cambiar de estrategia, suponiendo que la estrategia del adversario es fija.

(c) Encuentre las ganancias esperadas del jugador B cuando sigue la estrategia de (b). Exprese su respuesta como una suma de términos simples y como una aproximación numérica. ¿Depende el valor de la estrategia que utilice el jugador A?

Este es mi mejor intento hasta el momento para resolver este problema.

(a) Parece bastante obvio que el jugador $B$ maximizaría sus ganancias esperadas eligiendo el valor de $j$ tal que $j \cdot p_j$ es el más alto. Pero, estoy teniendo dificultades para formalizar esto (o demostrarlo matemáticamente) en términos de una ecuación para el valor esperado de $B$ especialmente porque conocemos las probabilidades de que $A$ elegirá algún número, al igual que $B$ pero no la probabilidad de que $B$ adivinará algún número. ¿No es la expectativa en el caso la suma sobre los posibles resultados, multiplicada por la probabilidad de que $B$ adivina correctamente, dada (condicionada) la elección por $A$ ?

(b) Si el jugador $B$ son la suma de los enteros de $1$ a $100$ (todos los $j$ ) y la probabilidad asociada del resultado es la probabilidad tanto de que el jugador $A$ seleccionó un número entero en particular, que es $p_j$ y la probabilidad de que el jugador $B$ adivinó ese número entero, que podemos anotar como $\frac{a}{j}$ por la proporcionalidad, la expectativa se derrumba a $\sum j \cdot p_j \cdot \frac{a}{j} = \sum a p_j = a \sum p_j = a$ ya que estas probabilidades asociadas sin las acciones de los jugadores $A$ y $B$ son independientes y las probabilidades sobre todas las $p_j$ a la suma de $1$ ya que el jugador $A$ tendrá que elegir algo. Ya que $a$ es una constante, no hay ningún incentivo para $B$ para cambiar su estrategia. (Aunque no parece que $A$ puede ganar cualquier cosa, así que no veo por qué deberíamos considerar su estrategia, a menos que su objetivo sea minimizar $B$ de las ganancias).

c) No sé cómo calcularla, ya que en la parte (b) hemos elegido que sea una constante arbitraria.

Agradecería cualquier idea útil al respecto. Gracias de antemano.

1voto

saulspatz Puntos 116

A) B debe elegir el $j$ que maximiza $jp_j.$ Ninguna desviación de esto puede aumentar su expectativa. Si hay una $k\neq j$ tal que $kp_k=jp_j,$ entonces elegir $k$ algunas veces dejará la expectativa sin cambiar. Elección de $m$ con $mp_m<jp_j$ algunas de las veces bajará la expectativa.

b) Se nos dice que $p_j={a\over j},$ pero sabemos que $\sum_{j=1}^{100}{p_j}=1,$ así que $${1\over a} =\sum_{j=1}^{100}{1\over j}$$ Ahora, sea cual sea el número que elija B, su expectativa es $a$ y mientras A siga la misma estrategia, no puede haber ninguna razón para cambiar. Por otro lado, si consideramos que la estrategia de B es fija, la misma consideración se aplica a A; haga lo que haga, su expectativa es $-a$ por lo que no hay ningún incentivo para cambiar.

c) Como sabemos que la expectativa es $a,$ así que esto es sólo una cuestión de aproximación $\sum_{j=1}^{100}{1\over j}$

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X