4 votos

teorema del muestreo opcional

Te reparto una baraja estándar de 52 cartas boca arriba, una carta cada vez. Antes de de repartir cualquier carta puedes gritar "AHORA". Si gritas "AHORA" y la siguiente siguiente carta que reparto es una reina, entonces el juego termina y te doy 100 dólares. Si la siguiente Si la siguiente carta no es una reina, entonces el juego termina y no te doy nada. ¿Cuál es el precio justo para que me pagues para jugar a este juego conmigo?

Lo que se me ocurre es utilizar el teorema del muestreo opcional y demostrar que es una martingala. Pero estoy un poco perdido en la configuración.

2voto

codified Puntos 462

Para este juego esta recursión se mantiene: $$f(a,n)=\max(\frac{a}{n}*f(a-1,n-1)+\frac{n-a}{n}f(a,n-1), \frac{a}{n})$$ donde $a$ es el número de reinas que quedan en la baraja, y n las cartas que quedan (la primera parte es el valor esperado de sacar una carta, y la segunda el valor esperado de decir "¡ahora!")

Digamos por hipótesis que el valor del juego en cada estado es $g(a,n)=a/n$ , puedes poner la ecuación anterior y ver que: $$f(a,n)=\max(\frac{a}{n}*\frac{a-1}{n-1}+\frac{n-a}{n}\frac{a}{n-1}, \frac{a}{n})=\max(\frac{(n-1)a}{n(n-1)}, \frac{a}{n})=\frac{a}{n}$$

Podemos usar la inducción sobre el juego tres, desde el nodo hoja (cuando sólo queda 1 carta) la expectativa para el juego es el número de reina (1 o 0), por lo que la fórmula se mantiene, y si en el nodo hijo la fórmula se mantiene, se mantiene también en el nodo padre por el lema anterior.

Así que este juego tiene expectativa $\frac{queen}{cards}$ para cada estrategia que diga "¡ahora!" al menos cuando sólo quede una carta.

0voto

Daniel Schierbeck Puntos 962

Esto se ofrece como una pista sobre cómo configurar su problema.

El precio justo será probablemente $\$ 100\cdot\frac4{52}= \$7.69$ , independientemente de la estrategia del jugador, que corresponde a la victoria esperada de un a priori estrategia para decir "ahora" justo antes de el $n$ de la tarjeta, donde $n$ se elige de antemano al azar.

Esperar hasta que $n-1$ las cartas han sido reveladas gana algo de información, pero potencialmente se pierden algunas oportunidades de ganar, así que hay una compensación. Por término medio, el precio base anterior podría ser perfectamente el precio justo.

El tiempo de espera (número $N$ de cartas para robar) para ver el $k$ La reina puede derivarse de el hipergeométrico distribución de probabilidades.

wait time for k queens: hypergeometric

Los valores esperados son $8,~17,~26,~35,~44$ para $0\le k\le 4$ . ¿Podemos construir una estrategia óptima como un algoritmo de decisión bayesiano? Supongamos que elegimos esperar al primer $n$ cartas a revelar. En este punto, el número de reinas mostradas tiene una distribución de probabilidad $$ \mathbb{P}\{K=k\}=\frac{{4\choose k}{48\choose n-k}}{{52\choose n}} $$ y, asumiendo $K=k$ las reinas han sido reveladas, las posibilidades de que la siguiente carta sea una reina son $\frac{4-k}{52-n}$ .

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X