Todo lo que puedo encontrar en el Índice Gittins es extremadamente profundo y abstracto, casi sin ejemplos. He pasado horas investigando en documentos académicos, notas de clase y fuentes de Wikipedia. Entiendo el Índice de Gittins conceptualmente, pero me gustaría incluirlo en un programa, así que necesito saber cómo calcularlo (aunque el algoritmo tenga una complejidad de n factoriales).
¿Hay alguien que pueda resolver un ejemplo sencillo como el siguiente?
Se trata de una versión del clásico problema del bandido de brazos múltiples:
Estoy en un casino, hay 3 máquinas M_1, M_2, M_3
Cada máquina paga \$1 for a win, \$ 0 para una pérdida
He jugado M_1 tres veces, tiene 2 victorias 1 derrota
He jugado M_2 cuatro veces, tiene 2 victorias 2 derrotas
He jugado M_3 dos veces, tiene 1 victoria 1 derrota
Si descuento los pagos futuros en un 50%;
¿Cuál es el índice Gittins de M_1?
(Un número real en forma decimal)
¿Qué pasos se dan para conseguir esa cifra?
(Un pseudocódigo sería estupendo)
Gracias por al menos leer el problema