1 votos

Cálculo del valor medio global en un juego de azar con medias relacionadas

Suponga que se le presenta el siguiente juego:

Interfaz de juego

Cómo funciona el juego:

  1. El jugador apuesta por uno o más símbolos.
  2. Se hace girar la rueda.
  3. Si la rueda cae en un símbolo por el que el jugador ha apostado, el jugador gana. Las ganancias se calculan multiplicando la apuesta del símbolo que ha caído por el valor del multiplicador que aparece junto al símbolo en la ruleta.

Lo que me cuesta es desarrollar una fórmula que relacione las medias de cada símbolo para poder calcular la media global. ¿Por qué se relacionan las medias? Porque la rueda sólo puede caer en un solo símbolo en una ronda pero se pueden hacer apuestas a cada símbolo por separado.

Lo que se me ha ocurrido hasta ahora es lo siguiente:

Supongamos que sólo consideramos 1 símbolo a la vez y tratamos todos los demás símbolos como posiciones perdedoras, podemos calcular su media (también conocida como media teórica o retorno al jugador) de la siguiente manera:

$$ \overline{x}=\frac{1}{m}\sum f_ix_i$$

Donde $\overline{x}$ es la media, m es el número de posiciones posibles, f es el número de posiciones para un símbolo específico (su probabilidad) con multiplicador de x (su "peso").

Así, la media de cada símbolo por separado sería:

  • $\overline{x_{apple}} = \frac{1}{16} (3\times6 + 3\times3) = \frac{27}{16} = 1.6875$

  • $\overline{x_{banana}} = \frac{1}{16} (1\times20 + 1\times5 + 2\times3) = \frac{31}{16} = 1.9375$

  • $\overline{x_{banana}} = \frac{1}{16} (1\times15 + 2\times5 + 3\times3) = \frac{17}{8} = 2.125$

He simulado los 3 escenarios anteriores con 10000000 rondas utilizando la fórmula siguiente para calcular la media real:

$$ \overline{x}=\frac{1}{n}\sum \frac{w_i}{b_i}$$

Donde n es el número total de rondas, w es la cantidad ganada en la ronda y b es la cantidad que se ha apostado para la ronda.

De esto surgieron dos cosas:

  1. La media real mostró una convergencia con la media teórica.
  2. El valor de la apuesta no ha influido en el resultado, ya que se han realizado muchas simulaciones para cada símbolo con diferentes valores de apuesta. Algunas ejecuciones se hicieron incluso con valores de apuesta aleatorios utilizando un RNG.

Nota: El juego presentado arriba es un modelo simplificado de juego en el que estoy trabajando, sin embargo la solución puede proporcionar una visión para otros sobre cómo las medias relacionadas afectan a la media general.

Por favor, ayuda, estoy atascado en esto desde hace días. Cualquier idea de orientación o fórmulas será muy apreciada.

0voto

Michael Puntos 5270

Esto formaliza mis comentarios anteriores. Sea $(b_B, b_G, b_A)$ sea el valor de la apuesta realizada en [B]anana, [G]rape, [A]pple. Suponemos que $b_B, b_G, b_A$ son no negativos y no todos cero. Sea $V$ sea el total que ganamos. Entonces $$ E[V] = \frac{1}{16}\sum_{i=1}^{16} b_i w_i $$ donde $w_i$ es el peso de la ubicación $i \in \{1, ..., 16\}$ ; $b_i$ es el valor de la apuesta de la fruta asociada a la ubicación $i$ . Esto se puede reescribir: $$ E[V] = b_B\underbrace{\left(\frac{1}{16}\sum_{i\in B}w_i\right)}_{\theta_B}+ b_G\underbrace{\left(\frac{1}{16}\sum_{i \in G}w_i\right)}_{\theta_G} + b_A\underbrace{\left(\frac{1}{16}\sum_{i \in A}w_i\right)}_{\theta_A}$$ donde $B, G, A$ denotan los subconjuntos de lugares $i \in \{1, ..., 16\}$ asociados a Plátano, Uva y Manzana, respectivamente. Utilizando $\theta_B, \theta_G, \theta_A$ definidos por las llaves anteriores, obtenemos $E[V] = b_B\theta_B + b_G\theta_G + b_A\theta_A$ . La relación entre la rentabilidad esperada y la apuesta total es entonces: $$ \frac{E[V]}{b_B+b_G+b_A} = \left(\frac{b_B}{b_B+b_G+b_A}\right)\theta_B + \left(\frac{b_G}{b_B+b_G+b_A}\right)\theta_G + \left(\frac{b_A}{b_B+b_G+b_A}\right)\theta_A$$ En este caso tenemos \begin{align} \theta_B &= \frac{20 + 5 + 3 + 3 }{16} = 1.9375\\ \theta_G &= \frac{3+3+5+15+3+5}{16} = 2.125\\ \theta_A &= \frac{6+3+6+6+3+3}{16} = 1.6875 \end{align} Si desea utilizar $x_B, x_G, x_A$ como la fracción de nuestra apuesta que colocamos en cada fruta, así por ejemplo $x_B = b_B/(b_B+b_G+b_A)$ entonces $$\frac{E[V]}{b_B+b_G+b_A}=x_B\theta_B + x_G\theta_G+x_A\theta_A$$


Solución de máxima expectativa:

Para maximizar la expectativa debemos poner toda la parte de nuestra apuesta en la fruta que maximiza la suma de sus pesos, es decir, elegimos el máximo de $\theta_B, \theta_G,\theta_A$ . En este caso deberíamos apostar totalmente por la uva, por lo que $(x_B,x_G,x_A)=(0,1,0)$ para un pago esperado máximo por apuesta de 2,125.

Solución máxima en el peor de los casos:

El peso de cada fruta en el peor de los casos es de 3. Por lo tanto, si repartimos nuestra apuesta por igual entre todas las frutas, con el vector de fracciones $(x_B,x_G,x_A)=(1/3, 1/3, 1/3)$ En el peor de los casos: $$ \frac{V}{b_B+b_G+b_A} \geq (3)(1/3)=1 \quad \mbox{always} $$ Esto significa que nunca perdemos dinero . No es difícil ver que este reparto equitativo maximiza el pago por apuesta en el peor de los casos. Con este reparto equitativo obtenemos un pago esperado por apuesta de: $$ \frac{E[V]}{b_B+b_G+b_A} = \frac{\theta_B}{3}+\frac{\theta_G}{3}+\frac{\theta_A}{3}\approx 1.91666666 $$ Esto no es tan alto como el pago esperado por apuesta asociado a colocar todo en la uva. Sin embargo, apostar todo a la uva significa que podemos perderlo todo (riesgo no nulo), mientras que este esquema de asignación equitativa garantiza que nunca perderemos dinero (riesgo nulo), y además se espera que ganemos dinero. Por lo tanto, todo el mundo querría jugar a este juego, pero el patrocinador de este juego quebraría rápidamente.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X