5 votos

Modificado el juego del pirata

El juego del pirata es un conocido problema que se le pide con frecuencia en las entrevistas (que es la forma en que me topé con ella). El problema pide

Hay 5 racional de los piratas, a, B, C, D y E. Se encuentran en las 100 monedas de oro. Ellos deben decidir cómo distribuir. Los piratas tienen un estricto orden de antigüedad: a es superior a B, que es superior a C, que es superior a la D, que es superior a la E. El pirata del mundo de las reglas de distribución son así: que la mayoría de los altos pirata debe proponer una distribución de monedas. Los piratas, incluyendo el proponente, a continuación, a votar sobre si aceptar esta distribución. Si la asignación propuesta es aprobada por una mayoría o un empate en la votación, en la que sucede. Si no, el proponente es arrojado por la borda del barco pirata y muere, y el siguiente más altos pirata, se hace una nueva propuesta para iniciar el sistema de nuevo. Los piratas basar sus decisiones en los tres factores. Primero de todo, cada pirata quiere sobrevivir. Segundo, dada la supervivencia, cada pirata quiere maximizar el número de monedas de oro que recibe. En tercer lugar, cada pirata prefiere lanzar otro por la borda, si todos los otros resultados de lo contrario sería igual. Los piratas no confiar el uno en el otro, y no hará ni honor promesas entre los piratas aparte de la principal propuesta.

Vamos a considerar este problema sin la tercera condición (en mi opinión, los piratas no ser muy racional, si no pueden hacer ninguna de las propuestas). ¿Cuál sería la solución en este caso?

Considerando un caso con sólo tres piratas, a, B, y C, la solución original se propone que sólo le da una moneda a C a maximizar sus ganancias. Esto es debido a que si solo B y C siendo a, B puede acumular todo el oro y todavía mantener un empate en la votación.

Sin embargo, C sabe que B siempre va a votar "no" (ya que él consigue todo lo contrario), así que no puedo decir que él va a votar por el "sí" con una probabilidad de $\frac{x}{100}$ donde $x$ es el número de monedas que recibe en la distribución (supongamos que a y C tienen una totalmente digno de confianza manera de hacer esto). Si tratamos a la muerte como equivalente a la obtención de ningún oro, entonces ¿no sería el esperado piezas de oro que C recibe el ser $50$?

Este es sólo uno de estrategia, la cual no incluye B. ¿Cuál es la estrategia óptima para cada pirata incluso en este caso simple?

1voto

JiminyCricket Puntos 143

Su versión plantea una serie de puntos interesantes.

No estoy de acuerdo con Chris comentario acerca de los piratas infinitamente prefiriendo la vida de más de monedas. En la versión estándar, no existe la posibilidad de medir el peso relativo de estos resultados para los piratas, ya que con determinista resultados no hace ninguna diferencia si contamos la muerte como $0$ monedas o como $-\infty$ monedas; esta cuestión sólo se plantea en el probabilístico versión. Desde su declaración de que C puede conseguir $50$, deduzco que cuentan la muerte como equivalente a $0$ monedas (así que la vida sin dinero no significa nada para los piratas), y voy a asumir que este en la siguiente.

Su versión se plantea el problema de la no-amenazas creíbles. Se escribe "supongamos que a y C tienen una totalmente confiable manera de hacer esto". Sin embargo, esa confianza manera tendría que ser integrado en la votación de las normas. No es suficiente que exista algún mecanismo por el cual C de forma fiable y sin oportunidad para la manipulación de determinar al azar voto conforme a los acuerdos de distribución. Ella también tiene que ser de alguna manera restringido a la realidad que voten de acuerdo a ese resultado, ya que no en su interés hacerlo, no importa lo que ella había prometido antes, y esto no puede ser hecho por algún mecanismo – un voto es necesariamente un acto voluntario, por lo que incluso una máquina mecánica que mueve a su boca para formar un "sí" o "no" no haría. Por lo que "el pirata del mundo de las reglas de distribución" necesita ser cambiado en el nivel normativo – debe ser imposible voto contrario a un acuerdo. (Como alternativa, los piratas podrían ser asumidas tener una totalmente interiorizado código de honor que les impide romper acuerdos, violando de esta manera la original premisa de que son racionales.)

Así que vamos a suponer que este problema ha sido resuelto y que los piratas pueden hacer promesas acerca de cómo van a votar. No ha especificado cómo las negociaciones sobre estas promesas de continuar. A priori es posible que si B y C pueden cambiar sus promesas dependiendo de lo que el otro ha prometido, no puede ser un equilibrio. Vamos a ver primero cómo actuaría fijos promesas de B y C. En su mayoría de forma general, cada promesa es una función que asigna a cada propuesta de Un una probabilidad de rechazar. Por lo tanto, la probabilidad de que podría no sólo dependen de la promiser del compartir, pero también en la división entre los otros dos. Suponiendo Un riesgo-neutral, ella va a tratar de maximizar el número esperado de las monedas que recibe. Ya que ambos de los otros dos tienen que rechazar para que la propuesta sea rechazada, esto es $(1-p_Bp_C)n_A$ donde $n_A$ es el número de monedas de la propuesta asigna a Un y $p_B$ $p_C$ son las probabilidades de que B y C se rechaza la propuesta, respectivamente.

El valor de la propuesta de B es $100p_Bp_C+(1-p_Bp_C)n_B$, y el valor de C es $(1-p_Bp_C)n_C$, donde e $n_B$ $n_C$ es el número de monedas de la propuesta asigna a B y C, respectivamente. Dado alguna promesa por B, C elija una promesa que maximiza el valor esperado del juego para C. Que va a arreglar la propuesta de que elige (asumiendo que no hay empates). Tenga en cuenta que desde Una elige de manera determinista, C bien podría hacer su probabilidad de rechazo de la propuesta de que se elija $0$ y todos los otros $1$, ya que no va a cambiar la elección. Por lo tanto, si B s choice es fijo y C puede reaccionar a ella, no probabilística elemento en C de la estrategia después de todo – él sólo elige la mejor propuesta que se puede obtener Un hacer y, a continuación, promete a aceptar esa propuesta y rechazar todas las demás.

En el caso que se considera, donde B "promesas" para rechazar siempre, la mejor propuesta que C puede conseguir Un hacer es 1 y el 99 por C, y se compromete a aceptar esta propuesta y rechazar todas las demás propuestas, asegurando 99 monedas para sí mismo.

Si B y C pueden reaccionar a cada una de las otras promesas o negociar con A, si B y C se les permite tener estrategias mixtas, es decir, se puede elegir la opción "meta-distribuciones" sobre las probabilidades de rechazo que podría prometer, las cosas podrían complicarse.

1voto

Jeff Shattock Puntos 235

No tengo una respuesta completa, pero creo que esta es la forma en que vas a ver como. Estoy extiende desde @joriki la respuesta. Así que, por favor, lea la primera.

En el primer caso en que B no llegar a un acuerdo,

C puede decir, yo voy a votar por el sí, con una probabilidad de 1/(n-x+1), donde n es el número total de monedas (aquí 100) y x es el número de monedas que se presenta. Aquí, la mejor estrategia es dar a (n-1) monedas de a C y mantener a sólo 1.

Ahora, B también puede hacer una oferta. Todos los que Una puede hacer es distribuir tales que (1-pB pC)* nUn es maximizada. Si las distribuciones de probabilidad no son las mismas, Una voluntad de dar más monedas a la persona que ofrece un mejor aumento de la probabilidad por agregado de la moneda ($ \delta p _X/\delta n _X $)

Por lo tanto, para conseguir la mejor oferta,B y C tendrán que ofrecer la misma distribución que ofrece la mejor tasa de interés.

No he calculado la distribución con la mejor tasa de interés aún. Pero la escisión final sería algo así como 1, 49, 48 o algo similar.

P. S: he hecho un montón de mano que se agita aquí. Creo que B podría ofrecer una peor distribución de la función de C y aún así obtener el valor óptimo 100*pBpC+(1-pBpC)*nB. Necesito averiguar cómo encontrar el óptimo de la función de probabilidad de B y C.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X