2 votos

Tirar dados, número fijo de pruebas, ¿cuándo dejar de tirar?

Suponga que tiene una $k$ -su cara (etiquetada como $1, \ldots, k$ ). Quieres sacar el número más alto que puedas. Obtienes $T$ ensayos. Al tirar, puedes aceptar el número que has sacado, o puedes renunciar a ese número y volver a tirar, dejando $T-1$ pruebas restantes.

¿Cuándo hay que dejar de rodar?

Intuitivamente el número que se detiene tiende a $k$ como $T \to \infty$ y $k/2$ si $k$ es grande en relación con $T$ pero más allá de eso no tengo mucha intuición. Siento que debe haber una manera de establecer alguna recurrencia para resolver cuando debe parar.

Esto no son deberes, estoy practicando problemas de probabilidad para una entrevista que tengo próximamente, y vi este problema que me dejó perplejo. ¿Podría alguien explicármelo?

5voto

Matthew Scouten Puntos 2518

Supongo que quieres maximizar el valor esperado del número en el que te paras. Sea $f(T)$ sea el valor óptimo de este objetivo. Si se rechaza una tirada con $T$ pruebas restantes, su puntuación esperada es $f(T-1)$ . Así que debería aceptar cualquier tirada mayor que $f(T-1)$ y rechazar cualquiera por debajo de eso. La recursión es entonces $$\eqalign{f(T) &= \frac{\lfloor f(T-1)\rfloor}{k} f(T-1) + \sum_{j=\lfloor f(T-1) \rfloor + 1}^{k} \frac{j}{k}\cr &= \frac{\lfloor f(T-1)\rfloor}{k} f(T-1) + \frac{(k - \lfloor f(T-1) \rfloor)(k+\lfloor f(T-1) \rfloor + 1)}{2k}\cr} $$ con la condición inicial $f(1) = (k+1)/2$ .

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X