10 votos

Problema de teoría de juegos: Poker con farol

Espero que alguien me pueda ayudar con esto. El problema de que estoy hablando, se puede encontrar en el libro titulado "el Juego de la Teoría de la Evolución: Un Problema Centrado en la Introducción al Modelado de la Interacción Estratégica", por Herbert Gintis. El problema es el siguiente:

Ollie y Stan decide jugar el siguiente juego de poker. Cada uno tiene una terraza que consta de tres cartas, la etiqueta H (alto), M (medio), y L (bajo). Cada uno pone a 1 dólar en el bote, elige una carta al azar de su cubierta, y no mostrar la tarjeta a su amigo. Ollie (jugador 1) cualquiera de las estancias, dejando el bote sin cambios, o sube, la adición de 1 dólar a la olla. Stan a su vez hace la misma decisión. Si tanto aumentar o ambos estancia, el jugador con la carta más alta gana el bote (que contiene 2 dólares si se quedaban y 4 dólares si se recaudaron), y si el empate, que acaba de tomar su dinero de vuelta. Si Ollie plantea y Stan se queda, a continuación, Ollie se presenta el 3 de dólar bote. Sin embargo, si Stan subir y Ollie se queda, Ollie se presenta otra oportunidad. Él puede quitar, en caso de que Stan gana el 3 de dólar bote (sólo 1 dólar de los cuales es Ollie's), o puede llamar, la adición de 1 dólar a la olla. Entonces, como antes, el jugador con la carta más alta gana el bote, y con la misma tarjeta, ellos se llevan su dinero de vuelta. Un listado de juegos de poker con es el farol que se muestra aquí:

game tree

("? "en la figura significa que la rentabilidad depende de que tenga la carta más alta).

Las preguntas son:

una. Mostrar que Ollie tiene 64 puro estrategias y Stan tiene 8 puro estrategias.

b. Encontrar la forma normal del juego. Tenga en cuenta que aunque poker con el farol es mucho más simple que de poker real, la forma normal, es sin embargo, un 64 × 8 matriz! Si conoce la programación de la computadora, la resolución de este no es una tarea difícil, sin embargo.

c. Muestran que cuando se eliminan dominado estrategias sólo hay nueve puro estrategias para Ollie, y siete para Stan.

d. Mostrar que Ollie siempre se plantea con el H o M en la segunda ronda,y las gotas con L.

e. Supongamos que Stan ve Ollie primer movimiento antes de decidir quedarse o subir (es decir, los dos nodos donde Stan los movimientos son independientes los conjuntos de información). Ahora tiene que encontrar la forma normal del juego. Aviso de que esta matriz es de 64 x 64, por lo que el cálculo de este manual es bastante prohibitivo.

f. Eliminar dominado estrategias, y muestran que Ollie tiene sólo diez estrategias de la izquierda, mientras que Stan tiene doce.

g. Mostrar que Ollie siempre llamadas con una tarjeta de alta en el segundo rounda nd Stan siempre se plantea con una tarjeta de alta.


La primera es bastante obvia, pero el problema es la segunda pregunta. Así que se supone que debo escribir un 64 x 8 matriz, que yo prefiero hacerlo a través de programación (en el equipo - esto no es un problema). El problema es que no sé cómo calcular esta matriz. Lo que pongo en cada celda de la matriz? ¿Cómo puedo programáticamente calcular estos valores, de manera que puedo, a continuación, en la tercera pregunta, eliminar dominado estrategias?


EDITADO 28.6.:

Gracias a cada cuerpo por sus respuestas, pero sigo teniendo problemas. Esta es la forma en que quería solucionar este problema, pero algo no está sumando. Escribí un programa JavaScript que debe resolver este problema, pero no sé lo que me estoy perdiendo. El programa puede ser encontrado aquí: http://rok.pnv.si/poker/en.html y se ejecuta en su navegador, así que no tienes que instalarlo o cualquier cosa. La única cosa es, que cada vez que se carga la página, el ordenador calcula los pasos en la solución del juego, por lo que la carga de la página puede tardar algún tiempo, dependiendo de su equipo. El juego se puede encontrar aquí, con todos los comentarios y el código fuente: http://rok.pnv.si/poker/en.html. A continuación presento una descripción de lo que estoy haciendo. La misma descripción se puede encontrar en el enlace de arriba.

La forma en que empiezo se me anote todas las posibles puro estrategias si no me cuenta de la naturaleza de la elección (que las cartas serán delt) (esto es para que sus más evidente). Para Ollie estos son (RC), (RD), (SC), (SD), para Stan estas son (R) o (S). Si me cuenta de la naturaleza, de la que puedo obtener de 64 puro estrategias para Ollie y 8 para Stan. Para Ollie se ve algo como esto: (RC, RC, RC), (RC, RC, RD), (RC, RC, SC), (RC, RC, SD),... y Stan algo como esto: (R, R, R), (R, R, S), (R, S, R),... Para Ollie la primera estrategia (RC, RC, RC) significaría que si él consigue una tarjeta de baja: subir en primera ronda, llamada en segunda, y lo mismo para los de media y alta de las tarjetas. Para Stan es el mismo (la única diferencia es que Stan no tiene un segundo movimiento).

Así que con estas puro estrategias sé que el juego de cada una de las células en la forma normal matriz de juego, por lo que puedo calcular los valores de rentabilidad coresponding a estas células: para cada celda en la forma normal matriz de juego calculamos la rentabilidad de Ollie y Stan. El algoritmo para el cálculo de la (i,j)-ésimo elemento de la final de la forma normal del juego de la matriz es la siguiente: Primero construimos dos bucles con el que podemos recorrer todas las filas y todas las columnas, de manera que obtenemos a (i,j)-ésimo elemento de la final de la matriz. En este punto Ollie es el uso de la estrategia de i y Stan estrategia de j en la matriz de juego. A continuación, nos fijamos en la rentabilidad para cada jugador para (i,j)-ésimo estrategias en relación a las cartas que fueron delt (ir a través de cada combinación (9) de las tarjetas de la naturaleza podría haber delt). Multiplicamos cada pago por la probabilidad de que la naturaleza recogió las cartas (que siempre es 1/9) y la suma de los beneficios que surgen para las diferentes combinaciones de cartas. Esta es la rentabilidad que va en cada celda. Hacemos esto para Ollie y para Stan. El ejemplo se puede ver en el enlace de arriba.

Ahora tengo en la forma normal del juego. Así puedo continuar con la eliminación de dominante estrategias. Primer intento de este por la búsqueda de puntos de silla con minimax método (que puedo hacer porque este es un juego de suma cero) pero me extraña puntos de silla (están todos en una columna y no son demasiado pocos para obtener 9 puro estrategias para Ollie y 7 de Stan si puedo eliminar aquellas estrategias que no tiene un punto de silla). El ejemplo se puede ver en el enlace de arriba.

La segunda forma en que me trata de eliminar la dominante estrategias es por eliminación iterada de estrictamente dominada estrategias (si me incluyen débilmente dominada estrategias puedo obtener una sola celda para que el resultado final - que es uno de los puntos de silla encontrado con el método minimax). La forma en la que hago esto es: ir a través de cada fila y se compara con cada fila. Comparamos los primeros valores en cada celda de la fila con el primer valor de la coresponding celda de la segunda fila. Si nos encontramos con que cada valor de la primera fila es mayor que el valor de la segunda fila, declaramos que la estrategia en la segunda fila estrictamente dominada y eliminar esa fila. Después de la eliminación de pasar a las columnas (nos olvidamos de la comparación de las filas más en esta ronda). Nos fijamos en las columnas y repetir la anterior comparación, esta vez con columnas y la segunda los valores en cada celda. Esto constituye una ronda. Si hay alguna de las estrategias que fueron eliminados, volvemos a repetir todo el proceso en la ronda 2 y así sucesivamente hasta que en la ronda final al que no podemos eliminar más estrategias. Que es entonces la matriz estrictamente dominada estrategias eliminado. El problema aquí es, que no permanece 42 puro estrategias para Ollie y 7 para Stan. Que es demasiado para Ollie como debe ser sólo 9.

¿Qué estoy haciendo mal? El cálculo de las rentabilidades mal? La eliminación de las estrategias de malo (¿el orden de eliminación de la materia? - que yo sepa no en juegos de suma cero)? He estado en esto durante bastante tiempo ahora, y me parece que no puede averiguar. Cualquier ayuda se agradece.

2voto

Shabaz Puntos 403

Stan 8 puro estrategias consisten de una acción (o subir) para cada una de las 3 cartas. Uno de ellos es el aumento en H, la estancia en M o L. Uno de Ollie es subir en todas las tarjetas. En la celda de la matriz en la intersección de estas va el promedio de rentabilidad si ambos jugadores siguen esta estrategia. Así que usted vaya a través de los 9 posibles distribuciones de cartas, calcular la rentabilidad de Stan, un promedio de ellos, y lo puso en la matriz.

Para c, buscar un par de Stan estrategias donde Stan sale mejor, independientemente de lo que Ollie. Usted dice que no va a ser exactamente un par. Puede eliminar los elementos más pobres de la estrategia de la matriz. También dijo que usted será capaz de eliminar el 55 de Ollie estrategias. Para d, se nota que el resto de estrategias para Ollie todos de satisfacción de este.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X