4 votos

Estrategia óptima para elegir las cartas: ganar un dólar por el rojo, perder uno por el negro, y parar en cualquier momento

Supongamos que tengo cuatro cartas: dos negras y dos rojas. Las saco una por una. Cada vez que saco una carta roja, gano un dólar, y cada vez que saco una negra, pierdo un dólar. Puedo elegir parar en el momento que quiera. ¿Cuál es la estrategia óptima para elegir cuándo parar y cuál es su valor esperado?

Lo hice por fuerza bruta para conseguir $2/3$ pero no sé si hay una forma más inteligente por ahí.

4voto

John Fouhy Puntos 759

Dejemos que $E(r,b)$ sea el valor esperado de la estrategia óptima con $r$ rojo y $b$ tarjetas negras. Tenemos $$ E(r,b) = \max\left(0,\frac{r}{r+b}(1+E(r-1,b))+\frac{b}{r+b}(-1+E(r,b-1))\right). $$ Implementando esto en una computadora, obtuve $E(2,2) = 2/3$ .

Puede experimentar con otros valores utilizando este sage código. Tal vez descubras una fórmula.

def E(r,b):
    if r==0: return 0
    if b==0: return r
    return max([0,r/(r+b)*(1+E(r-1,b))+b/(r+b)*(-1+E(r,b-1))])

3voto

Graham Kemp Puntos 29085

Pierdes si sacas más cartas negras que rojas. Las dos estrategias para evitar esto son:

  • (1) Deténgase inmediatamente cuando haya sacado al menos más rojos que negros y
  • (2) Detente sólo cuando hayas sacado dos cartas rojas.

La rentabilidad esperada de (1) es $4/6$ y el rendimiento esperado en (2) es $4/6$ pero la primera estrategia tiene la menor varianza (o riesgo).

$$\begin{array}{|c|c|c|c|c|}\hline 1 & BBRR| & BRBR| & BRR|B & R|BBR & R|BRB & R|RBB \\ & 0 & 0 & 1 & 1 & 1 & 1 \\ \hline 2 & BBRR| & BRBR| & BRR|B & RBBR| & RBR|B & RR|BB \\ & 0 & 0 & 1 & 0 & 1 & 2 \\ \hline \end{array}$$

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X