1 votos

Equilibrio subjuego perfecto de Nash

Mi pregunta sobre los deberes se resume a continuación:

Hay 7 jugadores (digamos P1,P2,...,P7) intentando repartirse 100 dólares. El juego comienza con P1 proponiendo un reparto de los 100 dólares a cada jugador, es decir, P1 asigna una cantidad de dólares [0, 100] a cada jugador, incluido él mismo. A continuación, los demás jugadores P2..P7 votan simultáneamente "Sí" o "No" a la asignación de P1. Si la mitad o más de los jugadores votan "Sí", se aprueba la asignación y todos reciben la cantidad en dólares que se les ha asignado. Si menos de la mitad vota "Sí", entonces el jugador que está asignando (P1 en la primera ronda de este juego) recibe un pago de -1 y es eliminado de las siguientes rondas del juego. El juego continúa en la siguiente ronda pero con P2 intentando la siguiente asignación para los jugadores P2...P7. El juego continúa hasta que se aprueba la asignación propuesta (la mitad o más votan "Sí") o hasta que P7 es el único jugador que queda en el juego, en cuyo caso recibe los 100 dólares.

Utilizando el concepto de solución de equilibrio de Nash subjuego perfecto, ¿qué ocurre?

No sé muy bien cómo empezar esta pregunta, ya que no me dan un juego de forma extensiva, y si intentara hacer uno yo mismo, no sabría los resultados. Además, el tamaño de este juego de forma extensiva (alrededor de $2^0 + 2^1 + ... + 2^5$ nodos) es bastante poco práctico de resolver.

Mi intento está más abajo y hay que reconocer que es deficiente. Estoy bastante seguro de que estoy tomando el enfoque equivocado.

Intenté empezar desde la última ronda del juego e ir subiendo. La forma en que hice los juegos fue considerar un Px asignar y me gustaría dibujar la forma extensa juego de los jugadores Px + 1 .. P7 votar "sí" o "no". Para que estos juegos funcionen para cualquier asignación, asigné un pago de [0,100] a los caminos en los que se pasa la asignación.

Primero consideré el caso en el que P6 está asignando y P7 está votando e hice el juego de forma extensiva de esto. Encontré un equilibrio nash subjuego perfecto y la propuesta fracasó. A continuación, hice un juego de forma extensiva cuando P5 asigna y P6 y P7 vota. Utilizando el resultado del juego anterior se obtuvieron algunos resultados. La propuesta pasa esta vez. Pero ahora no pude encontrar el equilibrio de Nash perfecto subjuego cuando P4 asigna y P5, P6, P7 voto porque yo no sabía qué payoffs eran mejores para algunos jugadores (porque yo estaba asignando [0,100] a los caminos donde las propuestas pasaron. Para ser más específicos, había caminos en los que una estrategia llevaría a un pago de [0,100] que P4 asignaba y la otra llevaría a [0,100] que P5 asignaba).

El objetivo de hacer estos juegos era encontrar algún patrón en las acciones de cada jugador, pero el caso en el que P4 se asigna detuvo ese plan. El único patrón que descubrí fue que P7 siempre vota "No" cuando hay 2 o menos votantes.

Aparte de esto, no sé cómo proceder. Cualquier ayuda se agradece.

EDITAR: He olvidado una parte importante de la pregunta. La pregunta dice: focus on subgame perfect Nash equilibria when players vote "no" when they are indifferent between voting for or against it. Pido disculpas por mi descuido.

1voto

crf Puntos 2625

Edición: como señala joriki, esta solución no sirve en el caso de que la utilidad sea continua. Él proporciona una solución para el caso continuo. Estoy tomando $\epsilon$ aquí para ser la unidad discreta más pequeña de dinero (no sé si vamos a dólares o centavos, no importa).


Revise esto con sumo cuidado, ya que es posible que haya cometido algún error.

Bien, voy a introducir algo de notación aquí. El $u_i$ es la utilidad para el $i$ -ésimo jugador de un perfil de acción determinado. Un perfil de acción es un vector de todas las acciones que realizan los demás jugadores, por ejemplo, $\langle(100/7, 100/7, 100/7, 100/7, 100/7, 100/7, 100/7),yes,yes,yes,yes,yes,yes\rangle$ es el perfil de acción en el que el jugador 1 propone que se repartan el dinero a partes iguales y los jugadores del 2 al 7 votan todos que sí. Eso es super feo sin embargo, así que en su lugar voy a escribir esto: $p_j^i$ es la cantidad que el jugador $i$ recibe del $j$ -la asignación del enésimo jugador, y $u_i(p_j^i,pass)$ es la utilidad del i-ésimo jugador de cualquier perfil de acción en el que el jugador $j$ ofrece $p_j^i$ y pasa, y $u_i(p_j^i,fail)$ es jugador $i$ 's misma utilidad de esa oferta cuando falla.

Antes de analizar cómo se comportan determinados jugadores, pensemos en cómo deberían comportarse los jugadores en general. En cualquier fase del juego, la utilidad viene determinada por si la propuesta se aprueba o no. Por tanto, en cualquier fase del juego, el jugador $i$ es elegir qué acción elegir sujeto a esto: $$u_i(p_j^i,pass)=a \\ u_i(p_j^i,fail)=b$$

( $i,j$ no son necesariamente distintos). Si el jugador $i$ es un votante, debe votar sí cuando $a>b$ y deberían votar no cuando $b>a$ .

Obsérvese que el jugador adjudicador $j$ se enfrenta a esto en cada etapa:

$$u_j(p_j^j,pass)=p_j^j \\ u_i(p_j^i,fail)=-1$$

Así que jugador $j$ siempre quiere que se apruebe la moción, ya que el menor $p_j^j$ es 0. Por lo tanto, el jugador $j$ siempre maximiza $p_j^j$ con la condición de que se apruebe la moción.

Bien, veamos los detalles, por inducción hacia atrás.

En la última etapa P7 obtiene 100. Eso fue fácil.

En la penúltima etapa, cuando P6 está asignando, tenemos $$u_7(p_6^7,pass)=p_6 \\ u_7 (p_6^7 ,fail)=100$$ $$u_6(p_6^6,pass)=p_6 ^6 \\ u_6 (p_6^6 ,fail)=-1$$

Como hemos establecido, P6 quiere que se apruebe la moción (porque el oferente siempre quiere que se apruebe su moción), por lo que ofrece 100, y así en equilibrio en este subjuego $u_6=0$ y $u_7=100$ .

Ahora examinamos la etapa en la que P5 está asignando. Tenemos $$u_7(p_5 ^7,pass)=p_5^7 \\ u_7(p_5^7,fail)=100 \\ u_6(p_5 ^6,pass)=p_5^6 \\ u_6(p_5^6,fail)=0$$

No escribí la utilidad de P5 porque como ya establecimos, el oferente siempre quiere que se apruebe la moción. El jugador 7 prefiere votar afirmativamente a menos que $p_5^7=100$ en cuyo caso es indiferente. El jugador 6 prefiere votar sí siempre que $p_5^6>0$ . El jugador 5 puede conseguir un pase ofreciendo al jugador 6 cualquier cosa, por lo que el jugador 5 ofrece al jugador 6 una miseria, por ejemplo $\epsilon$ -y tenemos $u_7=0,u_6=\epsilon,u_5=100-\epsilon$ .

Cuando el jugador 4 está asignando tenemos $$u_7(p_4 ^7,pass)=p_4^7 \\ u_7(p_4^7,fail)=0 \\ u_6(p_4 ^6,pass)=p_4^6 \\ u_6(p_4^6,fail)=\epsilon \\ u_5(p_4^5,pass)=p_4^5 \\ u_5(p_4^5,fail)=100-\epsilon $$

El jugador 6 votará sí siempre que $p_4^6>\epsilon$ y el jugador 7 votará sí siempre que $p_4^7>0$ . El jugador 5 es una causa perdida en lo que respecta al jugador 4, pero eso está bien. El jugador 4 ofrece al jugador 6 $2\epsilon$ y el jugador 7 $\epsilon$ y tenemos $u_7=\epsilon,u_6=2\epsilon,u_5=0,u_4=100-3\epsilon$ .

Cuando el jugador 3 está asignando tenemos $$u_7(p_3 ^7,pass)=p_3^7 \\ u_7(p_3^7,fail)=\epsilon \\ u_6(p_3 ^6,pass)=p_3^6 \\ u_6(p_3^6,fail)=2\epsilon \\ u_5(p_3^5,pass)=p_3^5 \\ u_5(p_4^5,fail)=0 \\ u_4(p_3^4,pass)=p_3^4 \\ u_4(p_3^4,fail)=100-3\epsilon \\$$

A medida que vamos pasando por estas iteraciones, empieza a quedar claro que lo que realmente buscamos es la forma más barata de comprar un pase. El jugador 3 necesita comprar dos votos, lo que puede hacer ofreciendo al jugador 5 $\epsilon$ y el jugador 7 $2\epsilon$ por lo que tenemos el resultado $u_7=2\epsilon,u_6=0,u_5=\epsilon,u_4=0,u_3=100-3\epsilon$

Y de nuevo, con la asignación P2, $$u_7(p_2 ^7,pass)=p_2^7 \\ u_7(p_2^7,fail)=2\epsilon \\ u_6(p_2 ^6,pass)=p_2^6 \\ u_6(p_2^6,fail)=0 \\ u_5(p_2^5,pass)=p_2^5 \\ u_5(p_2^5,fail)=\epsilon \\ u_4(p_2^4,pass)=p_2^4 \\ u_4(p_2^4,fail)=0 \\ u_3(p_2^3,pass)=p_2^3 \\ u_3(p_2^3,fail)=100-3\epsilon$$

El jugador 2 necesita comprar 3 votos, que se compran más baratos ofreciendo a los jugadores 4 y 6 $\epsilon$ cada uno y jugador 5 $2\epsilon$ y así tenemos $u_7=0,u_6=\epsilon,u_5=2\epsilon,u_4=\epsilon,u_3=0,u_2=100-4\epsilon$

Finalmente llegamos a la primera etapa, en la que el Jugador 1 asigna. Tenemos,

$$u_7(p_1 ^7,pass)=p_2^7 \\ u_7(p_1^7,fail)=0 \\ u_6(p_2 ^6,pass)=p_1^6 \\ u_6(p_1^6,fail)=\epsilon \\ u_5(p_1^5,pass)=p_1^5 \\ u_5(p_1^5,fail)=2\epsilon \\ u_4(p_1^4,pass)=p_1^4 \\ u_4(p_1^4,fail)=\epsilon \\ u_3(p_1^3,pass)=p_1^3 \\ u_3(p_1^3,fail)=0 \\ u_2(p_1^2,pass)=p_1^2 \\u_2(p_1^2,fail)=100-4\epsilon$$

El jugador 1 necesita comprar 3 votos, que se compran más baratos ofreciendo $\epsilon$ a cada uno de los jugadores 7 y 3, y luego ofreciendo $2\epsilon$ a cualquiera de los jugadores 4 ó 6. Y así nuestro resultado final es: $u_7=\epsilon,u_6=0\text{ (or }2\epsilon),u_5=0,u_4=2\epsilon \text{ (or }0), u_3=\epsilon, u_2=0, u_1=100-4\epsilon$ con los jugadores 3, 4 (o 6) y 7 votando a favor de aceptar la oferta.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X