8 votos

Viaje esperado de paseo aleatorio en un juego arbitrario con múltiples pagos

Como se ha explicado aquí la distancia promedio o "viaje" de una caminata al azar con $N$ se aproxima el lanzamiento de monedas: $$ \sqrt { \dfrac {2N}{ \pi }}$$

Qué hermoso resultado ¿quién hubiera pensado $ \pi $ estaba involucrado! Sin embargo, ¿cuál sería la fórmula a utilizar para una tabla de pago arbitraria?

Por ejemplo, el lanzamiento de una moneda tiene la tabla de pagar:

  • 0.5 : -1
  • 0.5 : 1

...así que un 50% de posibilidades de ganar o perder un punto. Después de 10.000 lanzamientos de monedas, el viaje en promedio será $ \sqrt {10000 \cdot2 /{ \pi }} \approx 79.788$ .

Sin embargo, una tirada de dados en la que necesitas sacar un seis para ganar podría tener la tabla de pagos:

  • 0.8333.. : -1
  • 0.1666.. : 5

Después de 10.000 tiradas de dados, el viaje en promedio será de alrededor de 178. Sin embargo, sólo lo sé porque usé la simulación para forzar el resultado, no conozco la fórmula.

En términos más generales, una tabla de pagos podría tener múltiples entradas donde todas las probabilidades se suman a una:

  • probabilidad1 : pago1
  • probabilidad2 : pago2
  • probabilidad3 : pago3
  • ...
  • ...
  • probabilityN : payoutN

Tenga en cuenta que el total de los pagos puede no ser necesariamente cero. Podría ser ponderado para producir un juego injusto. Por ejemplo:

  • 0.75 : -1
  • 0.1 : 0.5
  • 0.15 : 4.5

Eso es un pago promedio de $-0.025$ con una variación de $3.811875$ y usando la simulación, obtengo $ \approx 268.8$ "Viaje" de 10.000 carreras. Pero, ¿cómo puedo averiguarlo directamente?

En otras palabras, ¿cómo encontraría el "viaje" promedio de una tabla de pago tan generalizada sin recurrir a la simulación? Como pregunta adicional, ¿sería esta cifra también una mejor indicación del riesgo de tal 'juego' en comparación con la desviación estándar de la tabla de pagos como se define aquí ?

Aquí está el código que usé para la simulación: http://pastebin.com/985eDTFh

Está escrito en C#, pero por lo demás está muy bien contenido. La mayor parte es una clase aleatoria rápida, pero puedes usar la clase aleatoria por defecto si lo prefieres. Además, si no usas C#, no te preocupes demasiado por convertir la función convertCSVtoPayoutTable() ya que puedes codificar la probabilidad y los arreglos de pago tú mismo si lo prefieres.

3 votos

En toda la generalidad, la asintótica es $\sqrt{2\sigma^2N/\pi}$ donde $\sigma^2$ es la varianza de un solo paso. En tu ejemplo de los dados, $\sigma^2=5$ por lo tanto, para $N=10'000$ , $\sqrt{2\sigma^2N/\pi}=100\sqrt{10/\pi}=178.4124116...$

0 votos

Pero eso ya te lo han explicado, ¿no?

0 votos

@Did: Gracias por los comentarios. Tu fórmula funciona para las tiradas de monedas y dados, pero cuando he probado para tres entradas o más, difiere de la simulación. Un ejemplo es: probabilidades = [0,75, 0,1, 0,15] y pago = [-1, 0,5, 4,5]. Esto supone una varianza de 3,811875, pero el "recorrido" medio según tu fórmula es de 155,779 (a 3dp), mientras que yo obtengo aproximadamente 268,8. ¿Podría comprobar su fórmula?

2voto

Colm Bhandal Puntos 2719

A partir de los comentarios, he aquí una respuesta a su pregunta. Básicamente, toda la confusión radica en la diferencia entre valor esperado y distancia esperada, al menos en mi caso. Para una distribución centrada en el origen, esta diferencia es enorme, y para grandes $N$ tiende a:

$$\sqrt{\dfrac{2\sigma^2 N}{\pi}}$$

Esto es claramente mucho mayor que el valor esperado, que es $0$ . Esto tiene sentido, intuitivamente, si se dibuja una distribución normal. Tenga en cuenta que, como está añadiendo variables aleatorias independientes con una media y una varianza bien definidas, está bien hacer la suposición de una distribución normal aproximada, por la teorema del límite central . La aproximación mejora con $N$ . Ahora, valores se cancelan en esta distribución normal, dejando una media de $0$ pero distancias no lo hagas. Vea las líneas en rojo en la imagen de abajo: son distancias, ambas contribuyen positivamente a la distancia esperada.

Normal centred at 0

De acuerdo, pero ¿y si la distribución se desplaza? ¿Qué hace esto a la media? distancia ? Lo que hace es acercarse mucho más al valor medio. La razón es que cuanto más se desplaza, a la izquierda o a la derecha, más pequeña es la cola positiva/negativa que queda. De ahí que la media distancia y la media valor tienden a lo mismo. Véase la imagen de abajo para saber de qué estoy hablando. En el cálculo de las expectativas valor La parte sombreada en rojo anula su correspondiente cola en el otro lado. En el cálculo de las expectativas distancia En cambio, la parte sombreada en rojo contribuye positivamente a la distancia total. Pero es tan pequeña que la diferencia es insignificante cuanto más se desplaza la distribución. Esto explica la minúscula discrepancia entre sus observaciones $263$ y la media real de $250$ . Tiene sentido: la distancia media absoluta debe ser mayor que la media, porque no hay "anulación" de las colas.

Shifted Distribution

Para ser más formales, escribamos algunas fórmulas. La distancia esperada es

$$E(|x|) = \lim_{n\rightarrow\infty}\dfrac{\sum_{i = 1}^n |x_i|}{n}$$

Mientras que el valor esperado es:

$$E(x) = \lim_{n\rightarrow\infty} \dfrac{\sum_{i = 1}^n x_i}{n}$$

Aquí $x_i$ es sólo una observación después de realizar el experimento para el $i^{th}$ tiempo. También $n$ es el número de experimentos . Es diferente a $N$ el número de pasos (tiradas de dados) por experimento. Ahora, dejemos que $U$ sea la bolsa (conjunto con multiplicidad) de valores $u_i$ en el conjunto de muestras observadas que son positivas. Y dejemos que $V$ sea la bolsa de valores $v_i$ que son negativos. Entonces también podemos expresar el valor esperado de la siguiente manera:

$$E(x) = \lim_{n\rightarrow\infty} \dfrac{\sum_{u_i \in U} |u_i| - \sum_{v_i \in V} |v_i|}{|U| + |V|}$$

Tenga en cuenta que $n$ es sólo el número de experimentos/ensayos y $|U| + |V| = n$ . Ahora, la distancia esperada es:

$$E(|x|) = \lim_{n\rightarrow\infty} \dfrac{\sum_{u_i \in U} |u_i| + \sum_{v_i \in V} |v_i|}{|U| + |V|}$$

La única diferencia es un signo más. Claramente entonces, como cualquiera de los dos $U$ o $V$ domina debido a una media móvil, $E(|x|)$ tiende a $|E(x)|$ con un pequeño término de error. El término de error corresponderá a la cola sobrante (más pequeña) de la distribución en el eje positivo o negativo. Sin pérdida de generalidad, digamos que hay más valores negativos que positivos, es decir, que la cola positiva es más corta. Entonces, explícitamente, el término de error es:

$$E(|x|) - |E(x)| = \lim_{n\rightarrow\infty} \dfrac{2\sum_{u_i \in U} |u_i|}{n}$$

Cuando la media es $0$ este término de error se maximiza en:

$$\sqrt{\dfrac{2\sigma^2 N}{\pi}}$$

Pero como se puede ver en la forma de la curva normal, disminuye rápidamente. Esto concuerda con su observación, con un término de error de sólo alrededor de $13$ . Por supuesto, me doy cuenta de que esto no responde a la pregunta, ya que no he dado una fórmula explícita para el término de error. Pero creo que esta respuesta tiene suficiente valor intuitivo para explicar los resultados observados.

0 votos

He introducido los números $-0.025*10000 + \sqrt{2*3.811875*10000/\pi}$ pero obtuve apx 94 (o -405 si intenté usar negativo en lugar de positivo entre los términos). Esperaba 268,8 (o -268,8) como detallé en mi pregunta. ¿En qué me he equivocado? Supongo que $\sigma^2$ = 3.811875.

0 votos

Tal vez no te hayas equivocado. Tal vez me he equivocado. Voy a marcar esto al experto Did en los comentarios anteriores, si no es demasiado exasperado espero que tendrá una idea.

0 votos

Después de un número finito de ejecuciones $N$ el resultado es aleatorio. En términos generales, el CLT describe el límite de la probabilidad de que este resultado aleatorio $X_N$ está en torno a su expectativa $E(X_N)=\mu N$ en el $\sqrt{N}$ escala. De forma más rigurosa, considere el evento $A_N=[\mu N+a\sqrt{2\sigma^2N/\pi}<X_N<\mu N+b\sqrt{2\sigma^2N/\pi}]$ entonces el CLT afirma que $P(A_N)$ converge a algún $p$ en $(0,1)$ cuando $N\to\infty$ , donde $p=P(a<Z<b)$ para alguna variable aleatoria normal estándar $Z$ . Nótese que, formalmente, CLT no dice nada sobre la discrepancia entre $P(A_N)$ y $p$ cuando $N$ es grande ...

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X