5 votos

Equilibrio de Nash único en repetidas dilema del prisionero con factor de descuento que no sea ni muy alto ni muy bajo

En la página 47 de George J. Mailath y Larry Samuelson en Repetidas ocasiones de los Juegos y las Reputaciones: a Largo plazo de las Relaciones (Ver aquí), el escenario de juego del prisionero repetido dilema en el que el jugador 1 elige la fila, el jugador 2 elige la columna, se representa como una matriz,

enter image description here

Se afirma en un lexema, cuando el factor de descuento se encuentra no es ni muy alta ni muy baja, existe un equilibrio de ruta de acceso que de otra manera no puede ser obtenido.

enter image description here

La razón por la $(SE, EE^{\infty})$ constituye un equilibrio totalmente me escapa. La prueba es como sigue enter image description here

Pregunta: no entiendo por qué la primera desigualdad se refiere a $\frac{1-\delta}{\delta}$, ya que es un límite inferior para inducir el esfuerzo, mientras que en la mencionada desigualdad, el lado derecho es acerca de la rentabilidad de improductividad en el periodo corriente.

enter image description here

1voto

AndreaNobili Puntos 1142

La primera parte de la prueba de este lema está tratando de mostrar que no hay equilibrio en la que cualquier jugador juega $E$ hoy y su oponente juega $S$ en el período siguiente. (Este resultado intermedio implica que si un jugador juega $E$ hoy en día, su oponente debe jugar E en el período siguiente.) Como usted debe saber de haber llegado a este punto en el libro (la Proposición 2.5.1), cualquier equilibrio de rentabilidad par de hoy tiene que ser apoyado por la continuación de los valores de para los jugadores que son propios de equilibrio de ganar. (Esto es lo que significa para el equilibrio de los pagos a ser auto-generación.)

Entonces, ¿qué Mailath y Samuelson se están mostrando en el primer párrafo de su prueba del Lema 2.5.1 es que una estrategia en la que un juego de Correo hoy en día es seguido por el oponente jugando S mañana no puede ser parte de un equilibrio. En particular, si el jugador 2 juega E hoy, él consigue algunas de continuación de valor, que podemos llamar de $γ₂^{t+1}$. Esta continuación de valor ha de satisfacer dos condiciones. En primer lugar, $γ₂^{t+1}$ tiene que ser lo suficientemente grande como para que el jugador 2 en realidad quiere jugar E hoy (que es necesario para ser parte de un equilibrio). Que es, tiene que ser el caso de que $γ₂^{t+1}≥(1-δ)/δ$, que es el de la desigualdad dada por (2.5.2).

Segundo, $γ₂^{t+1}$ tiene que ser igual a los beneficios que el jugador 2 va a recibir. Que es, tiene que ser igual a $(1-δ)$ veces lo que el jugador 2 va a obtener en el período de $t+1$ $δ$ veces lo que el jugador 2 es la continuación de valor estará en el juego que sigue período de $t+1$. Bajo la propuesta de la estrategia, esto implica que

$$γ₂^{t+1}=(1-δ)u₂(Sa₂^{t+1})+δγ₂^{t+2}.$$

Siguiente, sabemos que si 1 es jugando $S$ en el período $t+1$, luego el jugador 2 es la adquisición de $0$ o $-1$. De cualquier manera, él está consiguiendo algo menos de $0$. Siguiente, sabemos que cuando se $δ≥1/3$, el más alto posible de equilibrio rentabilidad jugador 2 podría esperar de plazo,$t+2$$8/3$. Esto es lo que se consigue si los jugadores que jugaron $(SE,EE^{∞})$, en cuyo caso se obtendría $$(1-δ)⋅3+δ⋅2=3-δ≥3-1/3=8/3.$$ Queda por demostrar que esto es de hecho la más alta posible el equilibrio de la rentabilidad, que es el último párrafo de la prueba. Como resultado, a partir del $u₂(Sa₂^{t+1})≤0$$γ₂^{t+2}≤8/3$, se deduce que este segundo requisito implica que

$$γ₂^{t+1}≤8δ/3.$$

Y, por tanto, $γ₂^{t+1}$ tiene que satisfacer ambos $γ₂^{t+1}≥(1-δ)/δ$$γ₂^{t+1}≤8δ/3$, que sólo es posible a $δ>0.45$. Y por lo tanto tiene que ser el caso de que si un jugador juega $E$ hoy en día, su oponente juega $E$ el día de mañana.

También me gustaría añadir que el título de esta pregunta, no es lo que este lema en Mailath y Samuelson. La intención de este lema es proporcionar un ejemplo en el que (sin aleatorización de los dispositivos que convexify el conjunto de equilibrio rentabilidad en un juego repetido) el conjunto de equilibrio rentabilidades no es siempre creciente (en orden) en el factor de descuento.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X