5 votos

Índice Gittins para un ejemplo sencillo

Todo lo que puedo encontrar en el Índice Gittins es extremadamente profundo y abstracto, casi sin ejemplos. He pasado horas investigando en documentos académicos, notas de clase y fuentes de Wikipedia. Entiendo el Índice de Gittins conceptualmente, pero me gustaría incluirlo en un programa, así que necesito saber cómo calcularlo (aunque el algoritmo tenga una complejidad de n factoriales).

¿Hay alguien que pueda resolver un ejemplo sencillo como el siguiente?

Se trata de una versión del clásico problema del bandido de brazos múltiples:
Estoy en un casino, hay 3 máquinas M_1, M_2, M_3
Cada máquina paga \$1 for a win, \$ 0 para una pérdida
He jugado M_1 tres veces, tiene 2 victorias 1 derrota
He jugado M_2 cuatro veces, tiene 2 victorias 2 derrotas
He jugado M_3 dos veces, tiene 1 victoria 1 derrota

Si descuento los pagos futuros en un 50%;
¿Cuál es el índice Gittins de M_1?
(Un número real en forma decimal)
¿Qué pasos se dan para conseguir esa cifra?
(Un pseudocódigo sería estupendo)

Gracias por al menos leer el problema

3voto

Carlylean Puntos 31

Los índices de Gittins son difíciles de calcular. Este documento ofrece una buena visión general de varios algoritmos: http://www.ece.mcgill.ca/~amahaj1/projects/bandits/book/2013-bandit-computations.pdf

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X