Dado $2$ variables aleatorias $X, Y$ que toman valores enteros con distribución uniforme de $0$ a $100$ . Se trata de un juego en el que un valor aleatorio de $x$ viene primero & tienes que decidir si el valor aleatorio de $Y$ será mayor que $x$ o menos de $x$ . Obtendrá una recompensa de $y$ si su suposición es correcta y si no $0$ . Encuentre el valor que le gustaría pagar por el juego (es decir, maximice la expectativa de pago encontrando el valor del umbral $c$ si $x\ge c$ --> adivina tú $y < x$ y si $x < c$ --> adivina tú $y > x$ )
Respuesta
¿Demasiados anuncios?Usted tiene dos estrategias dicen $l$ por adivinar que $Y$ será menor que el $x$ y $g$ por adivinar que $Y$ será mayor que o igual a la $x$ (como en el ejercicio falta el caso de igual, hago la suposición de que se puede poner con mayor que). Ahora la recompensa esperada $R$ de cada elección es igual a $$R_l=\sum_{y=0}^{x-1}P(Y=y)\cdot y+P(Y\ge x)\cdot 0=\sum_{y=0}^{x-1}\frac{1}{101}\cdot y=\frac{1}{101}\cdot\frac{x(x-1)}{2}$$ y de manera similar $$\begin{align*}R_g&=P(Y< x)\cdot 0+\sum_{y=x}^{100}P(Y=y)\cdot y=\sum_{y=x}^{100}\frac{1}{101}\cdot y=\frac{1}{101}\cdot\frac{(x+100)(100-(x-1))}{2}\\\\&=\frac{1}{101}\cdot\frac{(100+x)(101-x)}{2}\end{align*}$$ Ahora la elección $g$ tiene una recompensa esperada mayor (o igual) que la elección $l$ si $$\frac{1}{101}\cdot\frac{(100+x)(101-x)}{2}\ge \frac{1}{101}\cdot\frac{x(x-1)}{2}$$ lo que equivale a $$-2x^2+2x+10100\ge0 \implies -(x+70.565)(x-71.565)\ge 0$$ Así, para cada $x$ en $\{0,1,\ldots 71\}$ $g$ tiene una mayor recompensa esperada y lo contrario para $x \in \{72, 73, \ldots, 100\}$ . En total, la estrategia óptima del jugador es $$\text{Optimal choice }=\begin{cases}\text{greater or equal than }, & 0\le x\le 71 \\ \text{less }, & 72\le x \le 100 \end{cases}$$ (El umbral $c$ es igual a $71.565$ ).