4 votos

Una conjetura acerca de los Equilibrios de Nash en juegos multijugador que implican la tarjeta de redacción

Una baraja de $N$ tarjetas se utiliza para jugar a 4 jugadores. El juego comienza con cada jugador al azar que se reparten 7 cartas de la baraja. Ellos se turnan según un conjunto de reglas, después de que un único ganador es coronado. Las reglas exactas del juego son complejas y no vale la pena explicar en detalle.

Ciertas cartas de la baraja son mejores que otros, así que los jugadores deciden instituir un pre-proyecto de juego para igualar la varianza. En el proyecto, cada jugador es al azar reparten 7 cartas cara abajo de la baraja. Cada jugador mira sus cartas, elige uno para mantener, y pasa el resto de los 6 cartas cara abajo al jugador a su izquierda. Después de que cada jugador ha hecho esto, el proceso se repite, esta vez a cada jugador la elección de las 6 cartas que recibe de su derecho, la elección de uno para mantener y, a continuación, pasar 5 para el jugador a su izquierda. Esto se repite hasta que cada jugador ha elegido exactamente 7 cartas. Que, a continuación, proceder con el juego real.

Supongamos ahora que el proyecto de la versión de este juego tiene un único Equilibrio de Nash de la estrategia, e imaginemos que 4 copias de este juego de estrategia uno contra el otro. Podemos definir dos funciones de las tarjetas que pueden ser representante de su fuerza:

Espera-proyecto-posición: La espera-proyecto-posición de una tarjeta de $c$, $\mathrm{EDP}(c)$, es la espera de la posición en la que $c$ está redactado, dado que el $c$ fue tratado en el proyecto. Por ejemplo, si una tarjeta de $c$ es siempre la primera carta redactada, a continuación,$\mathrm{EDP}(c)=1$. Si siempre es la última carta que redactó, a continuación,$\mathrm{EDP}(c)=7$. Tenga en cuenta que el promedio de $\mathrm{EDP}$ $N$ tarjetas deben ser de 4.

Ganar-probabilidad: La de ganar-probabilidad de una tarjeta de $c$, $\mathrm{WP}(c)$, es la probabilidad de que el jugador que redactó $c$ va a ganar el juego, dado que el $c$ fue tratado en el proyecto. Tenga en cuenta que el promedio de $\mathrm{WP}$ $N$ tarjetas debe ser de 0,25.

Conjetura: $\mathrm{EDP}(x) < \mathrm{EDP}(y)$ fib $\mathrm{WP}(x) > \mathrm{WP}(y)$ para todas las tarjetas de $x, y$.

Pregunta: Es esta conjetura verdadera? Si no, hay algunos "mínimas", hipótesis que podemos hacer acerca de las reglas del juego, por lo que se convierte en la verdadera?

Un poco de historia: yo soy parte de un juego de mesa de la comunidad, y por encima de dos estadísticas se calcula empíricamente a partir de nuestro juego de registros, que involucran a humanos imperfectos jugadores en vez de Equilibrio de Nash de estrategias. Para ciertos pares de cartas, mi conjetura no se sostiene, y yo estoy convencido de que este debe indicar que los jugadores son sub-óptima. Me gustaría estar seguro de que esta convicción a través de una demostración matemática.

1voto

Rachel W Puntos 41

Después de la discusión con bjorn, llegamos a la siguiente contraejemplo. Sin embargo, la parte de mi pregunta donde puedo preguntar sobre un conjunto mínimo de condiciones para hacer la conjetura de verdad se queda abierto.


Contraejemplo

Considere la posibilidad de una terraza con N=28 cartas, de modo que cada tarjeta es repartida en cada juego. Las cartas, $c_1, c_2, \ldots, c_{28}$, son positivos los valores reales, con $c_k = 1.0+k\epsilon$ positivos $\epsilon \ll 1$.

Decir reproductor $i$ ha redactado tarjetas de $S_i$. El juego funciona de la siguiente manera: el ganador es elegido al azar, con el jugador de la $i$'s posibilidades de la ganancia proporcional a $p(S_i)$, donde

$$ P(S) = \begin{cases} 10^{100},& \text{if } c_1, c_{28} \in S\\ \prod_{c\in S} c, & \text{otherwise} \end{casos} $$

El Equilibrio de Nash estrategia es clara: proyecto $c_1$ si es necesario. Otra cosa, el proyecto de la más alta disponible de la tarjeta. Claramente, en el equilibrio, la $10^{100}$ bono nunca será obtenida.

Es fácil ver que $\mathrm{EDP}(c_1) < \mathrm{EDP} (c_2)$ y $\mathrm{WP}(c_1) < \mathrm{WP}(c_2)$.

0voto

bjorn Puntos 311

Tarjeta de la redacción de los juegos son más a menudo jugado una tarjeta para cada jugador por turno. Como las reglas exactas son complejas, es más probable que los turnos del juego no son independientes y las cartas que un jugador recibe difieren en valor dependiendo de las otras cartas de un jugador. Es decir, el valor de una tarjeta específica será diferente para cada jugador en base a las otras cartas de un jugador. Si este es el caso y hay algunas combinaciones de cartas que valen más juntos, entonces podríamos encontrar fácilmente en circunstancias tales que la conjetura de EDP(x) < EDP(y) iff WP(x) > WP(y) es falsa. Cada jugador puede entonces ser separada de un Equilibrio de Nash estrategia dependiendo de las cartas que ya ha dibujado en el proyecto.

Para la conjetura para ser cierto, matemáticamente, se necesita el valor posicional de las cartas permanecen constantes. Dependiendo de las reglas del juego esto es posible, por ejemplo la conjetura sería si cada turno del juego es independiente de los demás se convierte en el juego, una carta por turno. Yo veo esto como un truco ganador de juego donde es fácil identificar cuando una tarjeta es mejor que la otra tarjeta.

0voto

mjqxxxx Puntos 22955

Aunque de forma heurística razonable, no creo que haya ninguna razón fundamental de que su desigualdad deben tener. He aquí un escenario que puede proporcionar un contraejemplo. Deje que la cubierta constan de un gran número de irrelevante tarjetas, además de tres importantes tarjetas de: $A$, $B$, y $C$. Tarjeta de $A$ aumenta sus probabilidades de la ganancia ligeramente, independientemente de lo que otras cartas fueron redactadas. Tarjeta de $C$ hace que perder con certeza. Finalmente, la tarjeta de $B$ le da una ventaja si la tarjeta de $C$ no se trató en absoluto; pero si la tarjeta de $C$ es tratado y elaborado (por cualquiera), tarjeta de $B$ perjudica sus posibilidades. Claramente nadie se elige voluntariamente $C$, así que voy a ir alrededor del círculo. Tarjeta de $B$ se convierte en más atractivo a medida que se vuelven más seguros de que $C$ no tratadas -- así como más tarjetas son vistos por usted o son elegidos por los demás, $B$ de aumento en valor (a menos que usted ve $C$). Por último, desde la tarjeta de $A$ es incondicionalmente ventajoso, que se ajustará inmediatamente (es decir, $\text{EDP}(A)=1$). Creo que el triunfo de probabilidades puede ser ajustado de modo que $B$ tiene una mayor probabilidad de ganar de $A$, pero está redactado más tarde (cuando el redactor tiene un poco más de información acerca de las otras tarjetas).

-1voto

Brian Puntos 1762

No creo que la respuesta puede ser fijo porque si un jugador sabe que el jugador en su derecho de utilizar una determinada estrategia y que todos los jugadores usan el mismo proceso de pensamiento como él, él va a mejorar su estrategia en consecuencia. A lo largo del tiempo, el jugador anterior se llega a saber de su estrategia y modificar su consecuencia, por lo que todos los jugadores después de él. Esto se volverá a repetir hasta que los jugadores se dan cuenta de que ellos no pueden burlarse de los otros jugadores. Que va a utilizar la mejor estrategia que funciona de forma independiente de los otros jugadores de las decisiones (y, probablemente, de mantener la mejor tarjeta con ellos cada vez).

Yo no sé acerca de las matemáticas, pero desde un punto de vista lógico, esta debe ser la respuesta. Es la misma razón por la que nunca puede ser una estrategia perfecta que funciona en contra de sí mismo en los juegos de cartas como el no-limit hold'em.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X