MOTIVACIÓN: voy a citar el artículo de la Wikipedia sobre el portero de fútbol para la motivación:
Algunos porteros incluso han marcado goles. Esto ocurre más comúnmente cuando un portero se ha lanzado hasta el extremo opuesto de la cancha para darle a su equipo una ventaja de ataque en los números. Esta precipitación es arriesgado, ya que deja el portero del objetivo de mutuo acuerdo. Como tal, es normalmente sólo se hace tarde en un partido en el conjunto de piezas donde las consecuencias de la puntuación superan con creces a los de encajar un objetivo adicional, como para un equipo de final en una eliminatoria del torneo.
La pregunta matemática: Considere el siguiente juego (simplificado de fútbol):
Un solo jugador empieza con una puntuación de 0.5 y juega N vueltas. En cada turno, el jugador tiene que elegir una de las 2 estrategias: $(p_{-1},p_0,p_1)$ o $(q_{-1},q_0,q_1)$ (estos son vectores de probabilidad) y, a continuación, su puntuación se incrementa por -1, 0 o 1 según el probabilites dictada por la estrategia elegida. El jugador gana si al final del juego tiene una puntuación positiva, y pierde si ella tiene una puntuación negativa (el objetivo del jugador es ganar, lo único que importa es si la puntuación final es positivo o negativo).
¿Cuál es la mejor estrategia global dado $N$, $(p_{-1},p_0,p_1)$ y $(q_{-1},q_0,q_1)$?
Una estrategia global es una función del número de vueltas a la izquierda, la puntuación actual y la 2 probabilidad de vectores (que son constantes para todos los turnos).
Si esta pregunta es difícil, es posible que todavía puede ser interesante para aproximar una óptima estrategia global (¿en qué sentido?).