8 votos

Pregunta de probabilidad: la estrategia óptima

Estoy realmente confundido acerca de cómo pensar sobre esta pregunta. Se presentaba como un desafío por parte de un compañero.

Dos personas buscan matar un pato en una ubicación de $Y$ metros desde su origen. Ellos a pie de $x=0$ $x=Y$juntos. En cualquier momento, uno de los dos puede sacar su arma y disparar a los patos, sin embargo, la probabilidad de que Una persona golpea a es $P_{A}(x)$ y la probabilidad de que la persona B hits es $P_{B}(x)$. También se sabe que $P_A(0)=P_B(0)=0$ $P_A(Y)=P_B(Y)=1$ y ambas funciones son funciones crecientes.

¿Cuál es la estrategia óptima para cada jugador?

9voto

Shabaz Puntos 403

Creo que ambos deben disparar a $P_A(x)+P_B(x)=1$. Si cualquiera de los brotes anteriores, la probabilidad de ganar es reducido. Si cualquiera de los brotes más tarde, el otro podría esperar media como mucho más tarde y a tener una mejor oportunidad de ganar. Pero ¿qué pasa si ambos golpear o ambos señorita?

6voto

Robert Christie Puntos 7323

Supongamos que el jugador $A$ recibe un disparo a distancia $x$, antes de que el jugador $B$. Él recoge el precio con $P_1 = p_A(x)$ de probabilidad, mientras que el jugador $B$ recoge el precio con una probabilidad de $P_2 = 1-p_A(x)$.

Si el jugador $B$ dispara al primer toque, a continuación, $A$ gana con probabilidad de $Q_1 = 1-p_B(x)$ $B$ gana con $Q_2 = p_B(x)$.

La estrategia óptima para $A$ es disparar en el punto de minimizar $B$'s de ganar, es decir,$x_A = \operatorname{argmin}_x \max(p_B(x), 1-p_A(X))$, mientras que la estrategia óptima de $B$ es disparar a $x_B = \operatorname{argmin}_x \max(p_A(x), 1-p_B(X))$.


Aquí está una visualización, suponiendo que el pato se encuentra en $Y=1$, e $p_A(x)$ $p_B(x)$ distribución beta acumulativa de la distribución de funciones:

enter image description here

2voto

Vincent Puntos 5027

Supongamos que las funciones de probabilidad $P_A, P_B$ son continuos, y que "el aumento" no significa "no-decreciente". Entonces no hay una única máxima intervalo cerrado en el que $P_A(x) + P_B(x) = 1$. Cada jugador de la estrategia es idéntica: disparar en cualquier momento de este intervalo. (Ross Millikan simul-publicado esta respuesta.)

Se hace un poco más complicado si $P_A$ o $P_B$ no es continua. Este es un escenario realista $-$, por ejemplo, la cima de una colina podrían ocultar el pato hasta un cierto punto (que puede ser diferente para cada jugador). Entonces podría haber un punto de $x$ antes de que $P_A + P_B < 1 - a$, y después de que $P_A + P_B > 1 + b$, para algunos estrictamente positivo $a,b$. Hay dos casos:

  1. $P_A$ es continua en a $x$, e $P_B$ no lo es. A continuación, $P_A$ debe disparar antes de $x$, pero como poco antes de $x$ como sea posible. Del mismo modo, si $A$ $B$ se intercambian.

  2. Ni $P_A$ ni $P_B$ es continua en a $x$. Entonces ningún jugador quiere disparar antes de $x$, y ninguno de los jugadores que quiere para permitir que el otro para disparar después de $x$. La situación se vuelve tensa, y las matemáticas tiene poco que decir; de hecho, el juego tal vez debería ser llamado "el pollo" en este caso, en lugar de "pato".

0voto

Martin Gordon Puntos 19587

Yo creo que debemos ser explícitos acerca de las rentabilidades en el caso de que ambos afectados simultáneamente y sobre el concepto de optimalidad. Supongo que buscar el equilibrio de Nash.

Vamos a considerar en 3 versiones:

Feria de cazadores de versión. El primero que golpea el pato obtiene +1. Si ambos afectados simultáneamente se obtienen +1/2 cada uno. No hay equilibrio de Nash en pura estrategias. Simultánea de la vacuna no puede ser un equilibrio, porque ambos jugadores quieren desviarse y disparar $\varepsilon$ anterior.

Los cazadores-enemigos. El primero que golpea el pato obtiene +1. Si ambos afectados simultáneamente se consigue 0 a causa de una pelea. No hay equilibrio de Nash como en la feria de cazadores de versión.

Hermanos cazadores. El primero que golpea el pato obtiene +1. Si ambos afectados simultáneamente se obtienen +1 cada uno (son muy sorprendido y feliz). En este caso, cualquier par de estrategia de $(x,x)$ tal que $P_A(x)+P_B(x)\geq 1$ es un equilibrio de Nash.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X