Dejemos que $p$ una variable aleatoria, uniformemente distribuida en $[0,1]$ . Dos jugadores $A$ et $B$ jugar al siguiente juego:
A partir de A, un jugador obtiene un valor aleatorio $p(\omega)\in[0,1]$ y tiene dos opciones:
i) Puede lanzar una moneda, con una probabilidad $p(\omega)$ de una cabeza. Si consigue una cabeza gana la partida, de lo contrario el otro jugador jugará con la misma distribución $p$ .
ii) Puede pasar el turno al otro jugador, pero dándole una distribución penalizada, es decir $p$ se sustituye, para ese turno, por una distribución uniforme sobre $[0,1-p(\omega)]$
Supongamos que ambos jugadores juegan de forma óptima, es decir, que eligen entre (i) y (ii) la que da la mayor probabilidad de ganar.
¿Cuál es la probabilidad de que gane el primer jugador?
EDIT: voy a intentar aclarar cómo se juega. En cada turno, el jugador actual obtiene una probabilidad aleatoria $p$ de la siguiente manera: si en el turno anterior su adversario ha lanzado la moneda (sin obtener cara, en cuyo caso el juego terminó), toma $p$ uniformemente en $[0,1]$ . Si su adversario no ha lanzado la moneda, toma $p$ uniformemente en $[0,1-\tilde{p}]$ , donde $\tilde{p}$ es la probabilidad con la que juega su adversario durante el turno anterior. Ahora el jugador actual puede elegir si lanzar la moneda (con una probabilidad de ganar $p$ ), o para pasar el turno.
0 votos
1) $p$ es fijo y conocido? 2) ¿qué has probado?
0 votos
Como sugieren los comentarios anteriores, las reglas de este juego no están nada claras. Es $p(\omega)$ ¿se arregló para todo el juego? Si no es así, ¿cuándo cambia? A primera vista, parece que B no tiene que tomar ninguna decisión estratégica. ¿Es eso cierto? Si no lo es, ¿cuándo tiene B la posibilidad de elegir?
0 votos
He editado mi pregunta. Espero que ahora las reglas sean mucho más claras.
0 votos
Creo que la norma puede no estar clara todavía. Por ejemplo, si $A$ toma $p$ y pasa el turno, mientras que $B$ tomar $p' \in [0,1-p]$ y pasa el turno de nuevo. Ahora, la voluntad $A$ tomar $p''$ en $[0,1-p']$ o $[0,1-p-p']$ ? Por su descripción, parece ser lo primero; sin embargo, si $p'<\frac{1}{2}$ No será un penalizado distribución más.
0 votos
Tomará $p''$ en $[0,1-p']$