El juego del pirata es un conocido problema que se le pide con frecuencia en las entrevistas (que es la forma en que me topé con ella). El problema pide
Hay 5 racional de los piratas, a, B, C, D y E. Se encuentran en las 100 monedas de oro. Ellos deben decidir cómo distribuir. Los piratas tienen un estricto orden de antigüedad: a es superior a B, que es superior a C, que es superior a la D, que es superior a la E. El pirata del mundo de las reglas de distribución son así: que la mayoría de los altos pirata debe proponer una distribución de monedas. Los piratas, incluyendo el proponente, a continuación, a votar sobre si aceptar esta distribución. Si la asignación propuesta es aprobada por una mayoría o un empate en la votación, en la que sucede. Si no, el proponente es arrojado por la borda del barco pirata y muere, y el siguiente más altos pirata, se hace una nueva propuesta para iniciar el sistema de nuevo. Los piratas basar sus decisiones en los tres factores. Primero de todo, cada pirata quiere sobrevivir. Segundo, dada la supervivencia, cada pirata quiere maximizar el número de monedas de oro que recibe. En tercer lugar, cada pirata prefiere lanzar otro por la borda, si todos los otros resultados de lo contrario sería igual. Los piratas no confiar el uno en el otro, y no hará ni honor promesas entre los piratas aparte de la principal propuesta.
Vamos a considerar este problema sin la tercera condición (en mi opinión, los piratas no ser muy racional, si no pueden hacer ninguna de las propuestas). ¿Cuál sería la solución en este caso?
Considerando un caso con sólo tres piratas, a, B, y C, la solución original se propone que sólo le da una moneda a C a maximizar sus ganancias. Esto es debido a que si solo B y C siendo a, B puede acumular todo el oro y todavía mantener un empate en la votación.
Sin embargo, C sabe que B siempre va a votar "no" (ya que él consigue todo lo contrario), así que no puedo decir que él va a votar por el "sí" con una probabilidad de $\frac{x}{100}$ donde $x$ es el número de monedas que recibe en la distribución (supongamos que a y C tienen una totalmente digno de confianza manera de hacer esto). Si tratamos a la muerte como equivalente a la obtención de ningún oro, entonces ¿no sería el esperado piezas de oro que C recibe el ser $50$?
Este es sólo uno de estrategia, la cual no incluye B. ¿Cuál es la estrategia óptima para cada pirata incluso en este caso simple?