31 votos

¿Cómo es preso ' dilema s diferente de pollo?

El pollo es un famoso juego en el que dos personas de la unidad en un curso de colisión directamente uno hacia el otro. Quien los virajes es considerado un 'pollo' y pierde, pero si nadie los virajes, ambos accidente. Entonces la rentabilidad de la matriz se ve algo como esto:

                  B swerves               B straight
A swerves            tie               A loses, B wins
A straight     B loses, A wins            both lose 

Pero he oído hablar de otra situación llamado el dilema del prisionero, donde dos presos se da a cada uno la opción de testificar en contra de los otros, o permanecer en silencio. La matriz de recompensas para el dilema del prisionero también se ve como

                  B silent               B testify
A silent            tie               A loses, B wins
A testify     B loses, A wins            both lose 

Recuerdo haber oído que en el dilema del prisionero, que siempre fue mejor para los dos prisioneros a testificar. Pero eso no tiene sentido, si se intenta aplicar a pollo: ambos conductores se bloquee cada vez, y en la vida real, casi siempre alguien termina desviarse. ¿Cuál es la diferencia entre las dos situaciones?

27voto

dagorym Puntos 2025

(Ver http://en.wikipedia.org/wiki/Chicken_%28game%29#Prisoner.27s_dilemma.)

La diferencia está en la rentabilidad. En el "pollo" de juego, la rentabilidad de la matriz es como

        Sw       St
   Sw  0,  0   -1, +1
   St +1, -1  -10, -10

Mientras que en el EP de juego:

        Si       Te
   Si  3, 3     0, 5
   Te  5, 0     1, 1

Ambos juegos tienen esta estructura en la tabla de pagos:

         C       D
   C   R, R     S, T
   D   T, S     P, P

Pero:

  • En la enfermedad de parkinson juego, el orden es el T > R > P > S
  • En el juego de Pollo, el orden es el T > R > S > P

Esto lleva a diferentes equilibrios de Nash. En el EP de juego, si permanece en silencio, B elige a testificar porque T > R, mientras que si Un testifica, B también debe testificar porque P > S. Para testificar es B la mayoría de la elección racional, después de considerar todas las posibilidades.

Pero en el juego de Pollo, como S > P, si Una va recta, B debe desviarse. Esto nos lleva a dos equilibrios de Nash en el juego puro: (St, Sw) y (Sw, St).

13voto

prakash Puntos 18075

Los juegos no son sólo acerca de ganar o perder, pero también acerca de la utilidad. Aquí está una más exacta de tabla para el pollo:

                  B swerves                B straight
A swerves    No gain for either          A loses, B wins
A straight     B loses, A wins         Both have large loss

Aquí está uno de los presos dilema:

                    B silent                        B testify
A silent       Both have small loss         A large loss, B loses nothing
A testify  B loses nothing, A large loss,        both medium lose 

En el dilema de los prisioneros, un individuo preso será siempre lo mejor, testificando (mira la tabla), sin embargo, por tanto, testificando que terminan en una posición peor que si ambos estaban en silencio. En contraste, el pollo, el recto será mejor si el resto de los virajes y quiebros será mejor si el otro va en línea recta. Las tablas representan algunas estrategias como igualmente bueno para los jugadores cuando no lo son.

4voto

Merbs Puntos 211

Descarada Publicidad: la Teoría de juegos propuesta en el Área 51, que debe totalmente a seguir!

El Dilema del Prisionero era un juego construido para un propósito muy específico:

Cada jugador tiene una estrategia preferida, que en conjunto resulta en un resultado inferior.

En la teoría de juegos de lenguaje, ambos jugadores tienen una estrategia dominante: sin importar el rival de acción, se debe elegir una acción específica (en este caso, una acción que normalmente se denomina Defecto). Si ambos jugadores eligen su estrategia dominante, que conduce a una (Nash) de equilibrio, de que ningún jugador se beneficia de desviarse. Este equilibrio es (Pareto) ineficiente en el sentido de que todos los jugadores prefieren una alternativa resultado. Vamos a ver esto en la práctica: \begin{vmatrix} \ & \color{verde}{Cooperar} & \color{verde}{Defecto} \\ \ \color{blue}{Cooperar} & \color{blue}{4},\espacio espacio\\color{verde}{4} & \color{blue}{5},\espacio espacio\\color{verde}{1} \\ \ \color{blue}{Defecto} & \color{blue}{1},\espacio espacio\\color{verde}{5} & \color{blue}{2},\espacio espacio\\color{verde}{2} \end{vmatrix}

Vemos que el $\color{blue}{blue}$ jugador de la rentabilidad es siempre más por Defecto que por Cooperar; eso es lo que significa ser una estrategia dominante. Lo mismo es cierto para $\color{verde}{verde}$. Si ambos jugadores eligen Defecto, el resultado es de $2,2$, que es inferior para que todos los jugadores el resultado de $4,4$.

El pollo fue construido en el mismo sentido para un propósito diferente:

Ningún jugador tiene una estrategia preferida, y todos los jugadores están en directa la rivalidad entre el uno con el otro.

A diferencia del Dilema del Prisionero, no hay ningún dominando las estrategias, y esto hace una gran diferencia. Por ejemplo, ¿qué haría usted elija en el siguiente juego: \begin{vmatrix} \ & \color{verde}{Cooperar} & \color{verde}{Defecto} \\ \ \color{blue}{Cooperar} & espacio \\espacio espacio\\color{blue}{0},\espacio espacio\\color{verde}{0} & espacio \\espacio espacio\\color{blue}{2},\color{verde}{-1} \\ \ \color{blue}{Defecto} & \color{blue}{-1},\espacio espacio\\color{verde}{2} & \color{blue}{-5},\color{verde}{-5} \end{vmatrix}

Su mejor estrategia es anti-coordinar con su oponente; es decir, a Defecto cuando se Cooperar y Colaborar cuando el Defecto. Pero si había una opción, preferiría ser uno de Desertar. La Defección mutua es el peor resultado y no es un equilibrio, pero tampoco es la Cooperación Mutua. De hecho, los equilibrios son cuando usted y su pareja anti-coordinar y es inherentemente contradictorio.

Así que en general, tenemos una simétrica matriz de recompensas: \begin{vmatrix} \ & \color{verde}{Cooperar} & \color{verde}{Defecto} \\ \ \color{blue}{Cooperar} & Recompensa & \color{blue}{T},\espacio espacio\\color{verde}{S} \\ \ \color{blue}{Defecto} & \color{blue}{S},\espacio espacio\\color{verde}{T} Y Castigar \end{vmatrix}

  • En la EP, $Tentación (T) > Recompensa (R) > Castigar a (P) > Sucker (S)$
  • En Ch, $Tentación (T) > Recompensa (R) > Sucker (S) > Castigar A (P)$

Si bien es cierto que el Dilema del Prisionero y el Pollo tienen diferentes preferencial ordenación de los resultados y por lo tanto diferentes equilibrios, los efectos de los dos juegos son completamente diferentes.

Interesantes Preguntas que Usted Podría Pedir (en la Teoría de juegos StackExchange):

  • ¿Qué sucede cuando cada juego es iterado (es decir, múltiples rondas)?
  • Qué sucede a medida que el número de jugadores aumenta (he.e bienes públicos juego)?

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X