Un equilibrio de Nash es un perfil de estrategias (s1,s2)(s1,s2) tal que las estrategias son las mejores respuestas entre sí, es decir, ningún jugador puede hacerlo estrictamente mejor desviándose. Esto nos ayuda a encontrar los equilibrios de Nash (de estrategia pura).
Para empezar, encontramos la mejor respuesta para el jugador 1 para cada una de las estrategias que el jugador 2 puede jugar. Lo demostraré subrayando las mejores respuestas: \begin {matriz} & A &B&C \\ A& \underline {1},1 & \underline {10},0 & -10,1 \\ B&0,10 & 1,1 & \underline {10},1 \\ C& \underline {1},-10 & 1,10 & 1,1 \end {matriz} El jugador 1 es el jugador de la fila, el jugador 2 es el jugador de la columna. Si 2 juega la columna A, la mejor respuesta del jugador 2 es jugar la fila AA o CC que le da 1 en lugar de 0 como recompensa. Del mismo modo, la mejor respuesta a la columna BB es la fila AA y a la columna CC es la fila BB .
Ahora hacemos lo mismo para el jugador 2 subrayando las mejores respuestas del jugador de la columna: \begin {matriz} & A &B&C \\ A& \underline {1}, \underline {1} & \underline {10},0 & -10, \underline {1} \\ B&0, \underline {10} & 1,1 & \underline {10},1 \\ C& \underline {1},-10 & 1, \underline {10} & 1,1 \end {matriz} Así, si el jugador 1 juega la fila AA entonces el jugador 2 responde mejor con la columna AA o columna CC , dándole 1 en lugar de 0. También encontramos las mejores respuestas para la fila BB y CC .
Ahora bien, un equilibrio de Nash de estrategia pura es una casilla en la que ambos pagos están subrayados, es decir, en la que ambas estrategias son las mejores respuestas entre sí. En el ejemplo, el único equilibrio de estrategia pura es (A,A)(A,A) . En todas las demás casillas, al menos uno de los jugadores tiene un incentivo para desviarse (porque le da una mayor recompensa).
EDITAR : ¿Cómo calcular los equilibrios de estrategias mixtas en juegos discretos?
En un equilibrio de estrategia Nash mixta, cada uno de los jugadores debe ser indiferente entre cualquiera de las estrategias puras jugadas con probabilidad positiva. Si este no fuera el caso, entonces hay una desviación rentable (jugar la estrategia pura con mayor retribución con mayor probabilidad).
Consideremos al jugador 2. Juega con la columna AA con probabilidad pp , BB con probabilidad qq y CC con probabilidad 1−p−q1−p−q . Tenemos que encontrar p,qp,q tal que el jugador 1 es indiferente entre sus estrategias puras A,B,CA,B,C . Es indiferente entre la fila AA (lado izquierdo) y la fila BB (lado derecho) si p,qp,q son tales que p+10q−10(1−q−p)=q+10(1−p−q).p+10q−10(1−q−p)=q+10(1−p−q). Es indiferente entre BB y CC si q+10(1−p−q)=p+q+1−q−p=1.q+10(1−p−q)=p+q+1−q−p=1. Sólo hay que resolver la primera condición para qq en función de pp , sustituto qq en la segunda condición y tienes pp . Inserción de pp de nuevo en la primera te da qq .
Ahora hacemos lo mismo con las estrategias para el jugador 1 tal que el jugador 2 es indiferente. El jugador 1 juega AA con probabilidad xx , BB con probabilidad yy y CC con probabilidad 1−x−y1−x−y . Las dos condiciones que siguen son \begin {ecuación} 1x+10y-10(1-x-y)=x+10(1-x-y) \\ x+10(1-x-y)=1 \end {Ecuación} Resuelve esto de nuevo para encontrar x,yx,y . Este es un equilibrio de estrategia mixta, porque ninguno de los dos jugadores tiene una desviación rentable. Recordemos que hemos construido el perfil (x,y;p,q)(x,y;p,q) tal que el otro jugador es indiferente entre sus estrategias puras. Por lo tanto, no importa cómo se desvíe unilateralmente el otro jugador, su recompensa esperada será idéntica a la del equilibrio (x,y;p,q)(x,y;p,q) . En general, según las soluciones x,y,p,qx,y,p,q puede haber infinitos equilibrios de Nash, o ninguno. Cuantas más estrategias puras haya, más tedioso será calcular los equilibrios de estrategia mixta, ya que resolvemos para N−1N−1 variables para cada jugador ( NN siendo el número de estrategias puras del otro jugador).