7 votos

Paradoja de la secuencia de monedas del libro de Martin Gardner

"Un evento menos frecuente a largo plazo es probable que ocurra antes que un evento más frecuente".

¿Cómo puedo demostrar que es más probable que aparezca THTH antes que HTHH con una probabilidad de

¡9/14, aunque el tiempo de espera de THTH es de 20 y el de HTHH, de 18!

Estaría muy agradecido si pudiera mostrarme el camino de

calculando la probabilidad de aparecer antes,

y el tiempo de espera. Gracias.

8voto

DiGi Puntos 1925

Imagina que mientras lanzas la moneda, llevas la cuenta de tu progreso actual para conseguir THTH y tu progreso actual para conseguir HTHH. Puede hacer esto con un par de números en el rango $0$ a través de $4$ El primer número le indica cuántas letras consecutivas de THTH tiene actualmente, y el segundo hace lo mismo con HTHH. Por ejemplo, supongamos que empiezas con THHTHTT; después de la primera T, estás a un paso de THTH, y no has avanzado hacia HTHH, por lo que tu estado actual es $\langle 1,0\rangle$ . Entonces obtienes una H, por lo que estás a dos pasos del camino hacia el THTH y a uno del HTHH, por lo que tu estado es $\langle 2,1\rangle$ . En esta secuencia de siete lanzamientos no se completa ninguna de las dos secuencias, aunque se consiguen tres pasos de cuatro en cada una de ellas, y después de estos siete lanzamientos se vuelve a empezar de cero, como se puede ver en la siguiente tabla:

$$\begin{array}{r|c} \bf{Tosses:}&&\bf T&\bf H&\bf H&\bf T&\bf H&\bf T&\bf T\\ \hline \bf{THTH:}&0&1&2&0&1&2&3&1\\ \bf{HTHH:}&0&0&1&1&2&3&2&0 \end{array}$$

La pregunta es qué probabilidades tiene de conseguir $4$ en la línea superior antes de obtener $4$ en la línea de fondo.

¿Qué estados son posibles? No es muy difícil comprobar que los únicos estados posibles además de los ya vistos en la tabla son $\langle 4,3\rangle$ cuando la THTH aparece primero, y $\langle 0,4\rangle$ Cuando HTHH aparece primero. Para cada uno de los siete estados no terminales $\langle m,n\rangle$ , dejemos que $p_{m,n}$ sea la probabilidad de que la THTH aparezca antes que la HTHH; estamos interesados específicamente en $p_{0,0}$ .

Si estamos en el estado $\langle 0,0\rangle$ con probabilidad $\frac12$ tiraremos a H y nos encontraremos en el estado $\langle 0,1\rangle$ y con probabilidad $\frac12$ tiraremos a T y estaremos en estado $\langle 1,0\rangle$ , por lo que debe ser que $$p_{0,0}=\frac12p_{0,1}+\frac12p_{1,0}\;.$$ Si estamos en el estado $\langle 0,1\rangle$ , con probabilidad $\frac12$ conseguimos H, poniéndonos de nuevo en el estado $\langle 0,1\rangle$ y con probabilidad $\frac12$ obtenemos T, poniéndonos en estado $\langle 1,2\rangle$ Así que $$p_{1,0}=\frac12p_{0,0}+\frac12p_{1,2}\;.$$ Continuando con este análisis, y multiplicando cada una de las ecuaciones por $2$ para despejar las fracciones, nos encontramos con el sistema:

$$\begin{cases} 2p_{0,0}=p_{0,1}+p_{1,0}\\ 2p_{0,1}=p_{0,1}+p_{1,2}\\ 2p_{1,0}=p_{2,1}+p_{1,0}\\ 2p_{1,2}=p_{2,3}+p_{1,0}\\ 2p_{2,1}=p_{0,1}+p_{3,2}\\ 2p_{2,3}=p_{0,4}+p_{3,2}=p_{3,2}\\ 2p_{3,2}=p_{4,3}+p_{0,0}=1+p_{1,0}\;, \end{cases}$$

desde $p_{0,4}=0$ y $p_{4,3}=1$ . De las ecuaciones segunda y tercera tenemos $p_{0,1}=p_{1,2}$ y $p_{1,0}=p_{2,1}$ y a partir de la sexta $p_{3,2}=2p_{2,3}$ por lo que podemos reescribir el sistema como

$$\begin{cases} 2p_{0,0}=p_{1,2}+p_{2,1}\\ 2p_{1,2}=p_{2,3}+p_{2,1}\\ 2p_{2,1}=p_{1,2}+2p_{2,3}\\ 4p_{2,3}=1+p_{2,1}\;, \end{cases}$$

que después de un trabajo un poco tedioso da la solución $p_{0,0}=\dfrac9{14}$ , según se desee.

Hay formas más ingeniosas, pero este es el enfoque más elemental que puedo ofrecer.

Desde un punto de vista intuitivo, no es difícil ver por qué es probable que lleguemos a THTH antes que a HTHH. Para llegar a HTHH, tengo que conseguir HTH. Ignorando el comienzo del juego, la mitad de las veces ese HTH es inmediatamente precedido por una T, y ya he terminado con el THTH. La otra mitad de las veces, el HTH va precedido de una H, y tengo un 50% de posibilidades de conseguir la H necesaria para completar el HTHH. Pero también tengo un 50% de posibilidades de obtener una T, lo que me deja con HTHT, y luego un 50% de posibilidades de obtener una H para terminar un THTH. En otras palabras, a partir de un HTH no terminal tengo un 25% de posibilidades de sacar TH$ y terminar con THTH. En otras palabras, dado que acabo de lanzar HTH, lo que debo hacer para terminar con HTHH, hay un 50% de posibilidades de que complete un THTH, y la otra mitad de las veces hay un 25% de posibilidades de que continúe con TH y termine con THTH. Por lo tanto, la probabilidad de que termine con THTH dado que acabo de lanzar HTH es al menos $\frac12+\frac12\cdot\frac14=\frac58$ .

5voto

psychotik Puntos 171

He aquí una solución no trivial y avanzada.

Considere un juego ideal en el que un croupier Alice lanza una moneda justa repetidamente. Después de que ella hizo su $(n-1)$ -a la hora de lanzar (o justo al principio del juego si $n = 1$ ), el $n$ -El jugador Bob se une a la partida. Apuesta $2^0\$$ que el $n$ -la moneda es $T$ . Si pierde, abandona el juego. Si no, gana $2^1\$$ , que apuesta a que el $(n+1)$ -la moneda es $H$ . Si pierde, abandona el juego. Si no, gana $2^2\$$ , que apuesta a que el $(n+2)$ -la moneda es $T$ . Esto continúa hasta que gana $2^4\$$ para $THTH$ y deja el juego, o el juego se detiene.

Así pues, dejemos que $X^{(n)}_k$ sea el v.r. de la ganancia del $n$ -el jugador hizo cuando $k$ -Se lanza una moneda al aire. Si dejamos que

$$X_n = X^{(1)}_n + \cdots + X^{(n)}_n,$$

Entonces es fácil ver que $X_n - n$ es una martingala nula en 0. Así, si $S$ denota el tiempo de parada de la primera ocurrencia de $THTH$ y si suponemos que $\mathbb{E}[S] < \infty$ entonces

$$0 = \mathbb{E}[X_{S} - S],$$

por lo que tenemos

$$\mathbb{E}[S] = \mathbb{E}[X_{S}] = 2^4 + 2^2 = 20.$$

Dejemos que $Y_n$ sea la ganancia total correspondiente a $HTHH$ y $T$ sea el tiempo de parada de la primera ocurrencia de $HTHH$ . Entonces tenemos

$$\mathbb{E}[T] = \mathbb{E}[Y_{T}] = 2^4 + 2^1 = 18.$$

Por último, dejemos que $U = S \wedge T$ sea el mínimo de $S$ y $T$ . Entonces también es un tiempo de parada. Ahora dejemos que $p = \mathbb{P}(S < T)$ sea la probabilidad de que $THTH$ precede a $HTHH$ . Entonces

$$ \mathbb{E}[U] = \mathbb{E}[X_{U}] = \mathbb{E}[X_{S}\mathbf{1}_{\{S < T\}}] + \mathbb{E}[X_{T}\mathbf{1}_{\{S > T\}}] = 20p + 0(1-p),$$

e igualmente

$$ \mathbb{E}[U] = \mathbb{E}[Y_{U}] = \mathbb{E}[Y_{S}\mathbf{1}_{\{S < T\}}] + \mathbb{E}[Y_{T}\mathbf{1}_{\{S > T\}}] = (2^3 + 2^1)p + 18(1-p).$$

Por lo tanto, tenemos $p = 9/14 \approx 64.2857 \%$ .

1 votos

Esta respuesta merece mucho más de 2 votos.

0 votos

Cuál sería el truco de la martingala para cuando la probabilidad de transición depende del estado previo, es decir, $(\rightarrow )\ne ( \rightarrow )$ ?

4voto

Did Puntos 1

He aquí un enfoque algo tedioso, pero seguro. Considere los pares de prefijos de las dos palabras objetivo $$ A=THTH\qquad\text{and}\qquad B=HTHH, $$ y el proceso de los prefijos más largos alcanzados en cada momento. Esto da lugar a una cadena de Markov, con cada probabilidad de transición $1/2$ sobre los estados $(O,O)$ , $(T,O)$ , $(O,H)$ , $(TH,H)$ , $(T,HT)$ , $(THT,HT)$ , $(TH,HTH)$ y los dos estados $A$ para indicar que la palabra objetivo $A$ se alcanza, y $B$ para indicar que la palabra objetivo $B$ se alcanza.

Para calcular las probabilidades de acertar $A$ y $B$ el gráfico de transición de esta cadena puede simplificarse un poco, dando lugar a $$ \begin{array}{cccccc} O,O & \rightarrow & TH,H & \stackrel{\longleftarrow}{\rightarrow} & THT,HT & \rightarrow & A \\ & \searrow & \downarrow\uparrow& &\uparrow & & \\ & & T,HT & \rightarrow & TH,HTH & \rightarrow & B \end{array} $$ La probabilidad $p_{00}$ para alcanzar $A$ antes de $B$ a partir de $(O,O)$ es tal que $2p_{00}=p_{21}+p_{12}$ , $2p_{21}=p_{32}+p_{12}$ , $2p_{12}=p_{23}+p_{21}$ , $2p_{32}=1+p_{21}$ y $2p_{23}=0+p_{32}$ con anotaciones que uno espera que sean autoexplicativas. Esto da como resultado $p_{00}=9/14$ . Obviamente, $p_{00}\gt1/2$ debido a la transición de $(TH,HTH)$ a $(THT,HT)$ .

Para calcular los tiempos medios de espera, el método es similar. Se utiliza para cada palabra la cadena de Markov que describe la longitud del prefijo más largo realizado.

Para la palabra $A$ las probabilidades de transición no nulas son de $0$ a $0$ y $1$ , de $1$ a $1$ y $2$ , de $2$ a $3$ y $0$ y de $3$ a $1$ y $4$ (palabra $A$ terminado). En términos de tiempos de espera, se obtiene el sistema de ecuaciones $t_0=1+\frac12(t_0+t_1)$ , $t_1=1+\frac12(t_1+t_2)$ , $t_2=1+\frac12(t_3+t_0)$ y $t_3=1+\frac12(t_1+0)$ Por lo tanto $(t_0,t_1,t_2,t_3)=(20,18,16,10)$ y el tiempo medio de espera es $t_0=20$ .

Para la palabra $B$ las probabilidades de transición no nulas de $0$ a $0$ y $1$ , de $1$ a $1$ y $2$ , de $2$ a $3$ y $0$ y de $3$ a $2$ y $4$ (palabra $B$ terminado). La única diferencia es la transición de $3$ a $2$ (en lugar de $1$ ) por lo que el tiempo de espera $t_0$ debería ser menor aquí. A saber, el sistema afín es ahora $t_0=1+\frac12(t_0+t_1)$ , $t_1=1+\frac12(t_1+t_2)$ , $t_2=1+\frac12(t_3+t_0)$ , $t_3=1+\frac12(t_2+0)$ Por lo tanto $(t_0,t_1,t_2,t_3)=(18,16,14,8)$ y el tiempo medio de espera es $t_0=18$ .

La causa de la diferencia entre estos dos tiempos de espera es fácil de localizar: en la media, la cadena utiliza una vez la transición de $3$ a $1$ respectivamente a $2$ . Para alcanzar $2$ de $1$ por si acaso $A$ las transiciones son $1/2$ de $1$ a $1$ y $1/2$ de $1$ a $2$ . Así, se perderá en la media una unidad de tiempo en el bucle $1\to1$ y una unidad de tiempo para realizar el paso $1\to2$ . Después se vuelve a la situación de la cadena $B$ y aparte de eso los dos caminos son idénticos. Por lo tanto, la cadena $A$ necesidades, en la media dos pasos más para llegar al destino.

4voto

dtldarek Puntos 23441

Basta con idear un conjunto de ecuaciones lineales ( $p=q=1/2$ ): \begin{align*} T &= pT+qTH \\ TH &= pTHT + qH \\ THT &= pT+q1 \\ H &= p(pT+q(pTHT+q0))+qH \\ X &= pT + qH \end{align*}

y después de resolverlo

\begin{align*} T &= 5/7 \\ TH &= 5/7 \\ THT &= 6/7 \\ H &= 4/7 \\ X &= 9/14 \end{align*}

Obtenemos $X = 9/14$ que es lo que estabas buscando. Que (1) significa conseguir THTH antes de HTHH. Lo que estas ecuaciones significan es que la probabilidad de (1) a partir de T es la misma que $1/2$ de probabilidad de (1) partiendo de TT (que equivale a T) y $1/2$ de probabilidad de (1) a partir de TH (que no es equivalente). El resto sigue el mismo camino.

Editar: Para ser más intuitivos (pero menos estrictos) observemos que si HTHH ocurre en una posición distinta de 0 (y eso ocurre con $1-1/16 = 15/16$ ), entonces con una probabilidad de al menos $1/2$ El THTH ocurre antes - debido a la probabilidad de T antes del HTHH. Sólo por eso sabes que la probabilidad de (1) es mayor que $15/16 \cdot 1/2 = 15/32$ . Sumando la probabilidad de THTHT (la última T es necesaria para que los eventos no se solapen) en la posición 0 (1/32) se obtiene 1/2 en total y no hemos contado todos las instancias todavía, así que seguramente la probabilidad de (1) es estrictamente mayor que 1/2.

Espero que eso ayude ;-)

2voto

Mikel Puntos 5809

Aunque otros ya han explicado las matemáticas de cómo obtener los tiempos de espera y la probabilidad de que una secuencia llegue primero, su dificultad fundamental de comprensión es reconocer que las distribuciones pueden tener formas diferentes, por lo que las tendencias de la media pueden no estar presentes al comparar los casos individuales entre sí en la distribución.

Tomemos como analogía el siguiente problema sencillo.

Dejemos que el sistema A tenga un tiempo de espera fijo de 10 (por ejemplo, es una máquina que fabrica un nuevo widget cada 10 minutos). Mientras tanto, dejemos que el sistema B tenga un tiempo de espera corto de 8 las tres cuartas partes del tiempo, y un tiempo de espera de 20 el otro 25% del tiempo (el 75% del tiempo tarda 8 minutos en hacer un widget; el 25% del tiempo tiene que hacer 12 minutos de recalibración antes de dedicar 8 minutos a hacer el siguiente widget). Si enciendes ambos sistemas (sin saber si el sistema B necesita recalibrar pronto) y preguntas qué sistema hará un widget primero, verás que el sistema B termina primero el 75% de las veces, por lo que B parece ser el sistema más rápido. Pero si se observa el tiempo medio para terminar, el sistema A tiene un tiempo medio de espera de 10, mientras que el sistema B tiene un tiempo medio de espera de $.75 \times 8 + .25\times20=11$ , lo que indica que el sistema A es el más rápido, aunque el 75% de las veces termina en segundo lugar.

Por lo tanto, no es paradójico que algo que es más rápido por el tiempo medio de espera, en realidad termine más lento más de la mitad del tiempo.

0 votos

Los tiempos de espera están sesgados por el tamaño en comparación con los tiempos de renovación

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X