5 votos

Maximizando el rendimiento de juegos de azar en el largo plazo

De fondo. Podemos jugar a un juego en el que podemos poner un dólar y salir a $X$ de dólares, donde $X$ es de 2 dólares con una probabilidad de $p>1/2$ o de cero dólares con una probabilidad de $1-p$. También se asume que las diferentes obras de este juego son independientes. Tenga en cuenta que $E[X] > 1$, lo que significa que tenemos una ventaja.

Comenzamos con un dólar y comenzar a jugar a este juego, de manera que podemos jugar con una fracción $f\in[0,1]$ de nuestro actual fortuna cada vez que jugamos.

Por lo tanto-y aquí nos vamos a $X,X_1,X_2,\ldots$ denotar (independiente) variables aleatorias tener la distribución de nuestras obras, como se describe anteriormente nuestros inicial de la fortuna es $F_0 = 1$, nuestra fortuna después de 1 juego de es $F_1 = 1-f+fX_1 = 1+f(X_1-1)$, y, en general, se calcula fácilmente que nuestra fortuna después de $n$ juega es $$F_n = \prod_{i=1}^n(1+f(X_i-1)).$$

Ya que las obras son independientes, esperado para nuestra fortuna después de $n$ juega es $$E[F_n] = E\bigg[ \prod_{i=1}^n(1+f(X_i-1)) \bigg] = (1+f(E[X]-1))^n.$$ Desde $E[X] > 1$, está claro que $E[F_n] \to \infty$ no importa lo $f$ elegimos.

Sin embargo, para todas las $n$ vemos que $E[F_n]$ es mayor para $f=1$. ¿Esto significa que debe elegir a $f=1$? Esta es probablemente una mala idea, porque en este caso, la probabilidad de ir a la quiebra después de $n$ o menos juega es $1-p^n$, que se aproxima a una como $n\to\infty$. En otras palabras, si elegimos $f=1$, finalmente se van a la quiebra por seguro. (Para una explicación más detallada de este, no dude en consultar a mi pregunta anterior, la Resolución de una paradoja relativa a un valor esperado.)

Entonces, ¿qué estrategia debemos seguir para maximizar nuestro rendimiento a largo plazo? Algunos autores han sugerido que el enfoque de la maximización de la "ritmo exponencial de crecimiento." Me explico.

Imagina que $F_n = e^{nG_n}$. Aquí, $G_n$ es el "ritmo exponencial de crecimiento" de $F_n$. Podemos escribir $$G_n = \frac{1}{n}\log(F_n) = \frac{1}{n}\log\bigg( \prod_{i=1}^n(1+f(X_i-1)) \bigg) = \frac{1}{n} \sum_{i=1}^n \log(1+f(X_i-1)).$$ Utilizando la ley de los grandes números, nos encontramos con que $$G_n \to E[\log(1+f(X-1))] \quad \text{almost surely}.$$ Ahora, $G := E[\log(1+f(X-1))]$ es lo que algunos autores refieren como el "ritmo exponencial de crecimiento", a la que debemos apuntar a maximizar. De hecho, $G$ parece ser el "ritmo exponencial de crecimiento" en el "infinito" en algún sentido.

En el presente caso, nos encontramos con que $$G = \log(1+f)p + \log(1-f)(1-p),$$ que-curiosamente-es maximizada en $f=2p-1$. De acuerdo a esto, tenemos la mayor ritmo exponencial de crecimiento si elegimos $f=2p-1$, y este es el valor de $f$ a que algunos autores sugieren que los jugadores colocan sus apuestas.

Pregunta 1. ¿Por qué debo preocuparme por esto? Me puedes dar alguna explicación intuitiva de por qué mi objetivo debe ser maximizar el ritmo exponencial de crecimiento, en lugar de maximizar $E[F_n]$ (es decir, para elegir a $f=1$), o la elección de $f=0.99$ mantener $E[F_n]$ alto, evitando que casi seguro de que la bancarrota? No tengo una sensación natural para qué hacer y por qué, con el fin de conseguir el tanto de crecimiento como sea posible en el largo plazo.

Pregunta 2. ¿Cómo puede ser posible que el ritmo exponencial de crecimiento es maximizada en $f=2p-1$, sin embargo, $E[F_n]$ es siempre la más alta de $f=1$? Que no tiene mucho sentido para mí. Usted no esperaría $E[F_n]$ a convertirse en la más alta en $f=2p-1$? En otras palabras, ¿cómo puede me-nos en el "infinito"-tiene el mayor crecimiento en$f=2p-1$, pero la mayor expectativa de valor en $f=1$?

Pregunta 3. Aquí es un gráfico que muestra $G$ como una función de la $f$$p=2/3$. asdf

El máximo es de hecho en $2p-1=1/3$. Sin embargo, algo interesante que ocurre alrededor de las $f\approx 0.618$, cuando la curva está por debajo de cero. Supuestamente, este es el punto más allá del cual estamos casi seguro que terminará con una pérdida, es decir, acabar con menos de 1 dólar. ¿Ahora entienden por qué es esto? Además, todavía sigue siendo un misterio para mí por qué la curva de $E[F_n]$ no muestran de manera similar características interesantes, en lugar de ser un monótonamente creciente en función de $f$.

3voto

JiminyCricket Puntos 143

En primer lugar, hay cierta imprecisión en aclarar. Introducir la $X$ como la cantidad de dólares recibidos. Esta toma diferentes valores con ciertas probabilidades, por lo que es una variable aleatoria. A continuación se calcula $E[X]$ y la fortuna $1+f(X−1)$ después de la primera jugada. Hasta ahora tan bueno.

Pero, a continuación, escriba $F_n = [1+f(X-1)]^n$. Aquí está la descripción de los resultados de $n$ obras de teatro, pero el uso de una única variable aleatoria $X$. Puesto que la cantidad de dólares recibidos pueden diferir de jugar a jugar, usted necesita separar la variable aleatoria $X_n$ para cada juego. En cada juego, su fortuna se multiplica por el factor de $1+f(X_n-1)$, por lo que su fortuna después de $n$ juega es

$$F_n=\prod_{k=1}^n\left(1+f(X_n-1)\right)\;.$$

La razón de esto no invalida todo su argumento es que, dado que cada $X_n$ se produce de forma lineal en $F_n$ y todos ellos tienen la misma expectativa de valor de $E[X]$, la expectativa de valor y no volver a

$$E[F_n]=\left(1+f(E[X]-1)\right)^n\tag 1$$

como lo escribió. Por cierto, no se habría llegado a esto si tu $F_n = [1+f(X-1)]^n$ había estado en lo correcto, ya que esta no es lineal y no se puede conmutar la formación de la expectativa con los no-lineal de las operaciones y como hizo para llegar a $(1)$.

Ahora, dado que su expectativa de valor estaba en lo correcto, tu pregunta acerca de cómo elegir los $f$ sigue siendo válido. Su idea para solucionar esto también es interesante y relevante, pero a mí me parece que por el fraseo en términos de una "tasa de crecimiento exponencial", te estás perdiendo de lo que yo consideraría como el punto central de la misma.

Esto también tiene que ver con la no-conmutatividad de la formación de la expectativa y no-lineal de las operaciones. En este caso, usted está formando la expectativa después de tomar el logaritmo. Vamos a configurar esto en una forma ligeramente diferente a arrojar algo de luz sobre cómo esto podría arrojar algo de luz sobre la "paradoja".

El dinero no es de utilidad. La utilidad de dinero disminuye cuanto más dinero se tiene. Ciertamente, si usted tiene $\$1,000$ and you get another $\$1,000$, vas a ser más feliz y tener más importante de las necesidades y deseos de cumplir con este dinero que si ya había $\$1,000,000$. Razonable de un modelo simple de esto podría ser que la utilidad del dinero es aproximadamente logarítmica.

Asumiendo este modelo, dado que la relación entre el dinero y la utilidad no es lineal, tenemos que decidir si formar el valor esperado del dinero o de la utilidad. No tiene mucho sentido a la primera forma que el valor esperado del dinero y, a continuación, tomar su utilidad, ya que el valor esperado no es una cantidad de dinero que hubiera en alguna de las situaciones posibles, pero una combinación lineal de todas estas. Lo que tenemos que hacer es, primero para cada situación que se encuentre la utilidad del dinero que habría en esa situación, y, a continuación, de forma que el valor esperado de todas estas utilidades.

Este es el lugar donde el cálculo del valor esperado de $G$. Tenemos

$$ \begin{eqnarray} U_n &=& \log F_n \\ &=& \log\prod_{k=1}^n\left(1+f(X_n-1)\right) \\ &=& \sum_{k=1}^n\log\left(1+f(X_n-1)\right)\;, \\ \end{eqnarray} $$

y así

$$ \begin{eqnarray} E[U_n] &=& E\left[\sum_{k=1}^n\log\left(1+f(X_n-1)\right)\right] \\ &=& \sum_{k=1}^nE\left[\log\left(1+f(X_n-1)\right)\right] \\ &=& nE[G]\;. \end{eqnarray} $$

Por lo tanto, con cada juego nuestro esperado logarítmica de la utilidad aumenta por $E[G]$, por lo que en este modelo que es lo que debe de maximizar.

Usted puede ser que desee comprobar hacia fuera los enlaces de la paradoja de San Petersburgo en los comentarios debajo de tu pregunta anterior, la Resolución de una paradoja relativa a un valor esperado (que, por cierto, habría sido una buena idea enlazar en esta pregunta para que la gente pueda construir sobre lo que está escrito allí.)

[Editar en respuesta a la Pregunta 3:]

Te preguntas por qué es que estamos casi seguro que terminará con una pérdida si $E[G]$ es negativo. Esto tiene que ver con el hecho de que $E[U_n]$ $n$- th múltiples de $E[G]$, mientras que el $E[F_n]$ $n$- ésima potencia de algo. De acuerdo con el teorema central del límite, la suma de los independientes e idénticamente distribuidas variables aleatorias converge (bajo las circunstancias adecuadas en un buen sentido) a una distribución normal. Desde el logaritmo de un producto es una suma, un producto correspondientemente converge a una log-normal de distribución.

La diferencia en el comportamiento de estas dos distribuciones es crucial. La distribución normal es simétrica, su media es proporcional a $n$ y su desviación estándar es proporcional a $\sqrt n$. Como resultado, a menos que la media de las distribuciones individuales es $0$, que con el tiempo casi seguramente terminan en el mismo lado de la $0$ como el valor esperado de la suma.

El registro de la distribución normal, por otro lado, es muy asimétrica. Se puede ver en este diagrama en el artículo de la Wikipedia que la media puede ser mucho mayor que la mediana y el modo. Como resultado, no hay ninguna contradicción en el valor esperado del producto aumentando sin límite, mientras que el área bajo la curva por encima de $1$ va a cero.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X