31 votos

Valor esperado de vueltas hasta HT consecutivamente

Supongamos que usted lanza una moneda repetidamente hasta que vea las Cabezas, seguido por un Las colas. ¿Cuál es el número esperado de la moneda para decidir tienes que voltear?

Mediante la manipulación de una ecuación basada en el resultado de la primera vuelta, que se muestra en este enlace:

http://www.codechef.com/wiki/tutorial-expectation

la respuesta es 6. Esto también tiene sentido intuitivamente ya que el valor esperado del número de lanzamientos hasta HH o el TT es de 3. Pero hay una manera de hacer frente a este problema mediante la suma de una serie de probabilidades multiplicado por los valores?

Gracias!

29voto

Aditya Puntos 76

Deje X ser la variable aleatoria que cuenta el número de lanzamientos hasta llegar a un T (colas). Entonces: $$E[X] = \frac{1}{2}\cdot1 + \frac{1}{2}(1+E[X])$$ $$\implies E[X] = 2$$ El primer término en el lado izquierdo es si queremos obtener un T en nuestra primera vuelta (con una probabilidad de $\frac{1}{2}$). El segundo término es si queremos obtener un H (cabezas) en nuestra primera vuelta (con una probabilidad de $\frac{1}{2}$), lo que significa que efectivamente estamos empezando con 1 flip extra.

Ahora vamos a Y ser la variable aleatoria que cuenta el número de lanzamientos hasta llegar a un HT de la secuencia. Entonces: $$E[Y] = \frac{1}{2}(1+E[Y])+\frac{1}{2}(1+E[X])$$ $$\implies E[Y] = 4$$ El primer término en el lado izquierdo es si queremos obtener un T en nuestra primera vuelta (con una probabilidad de $\frac{1}{2}$), lo que significa que efectivamente estamos empezando con 1 flip extra. El segundo término si queremos obtener un H en nuestra primera vuelta (con una probabilidad de $\frac{1}{2}$), entonces todo lo que quiero es un T, lo que significa que queremos contar 1 + número esperado de lanzamientos para conseguir un T.

17voto

Vicky Puntos 3303

Otra forma de resolver este problema es el uso de cadenas de Markov. Deje estado 0 ser el comienzo de estado. A continuación, con una probabilidad de 0.5 de que usted va a obtener los jefes y pasar a estado 1; con una probabilidad de 0.5 de que usted va a obtener colas y permanecer en el estado 0. Una vez en estado 1, aparecerá cabezas (probabilidad de 0,5) y se mantienen en estado 1 o se obtendrá colas (probabilidad 0.5) y pasar a estado 2 que es la aceptación de un estado.

Como una matriz de transición, entonces, tenemos:

$$ \begin{array}{c|ccc} & 0 & 1 & 2 \\ \hline 0 & 0.5 & 0.5 & 0 \\ 1 & 0 & 0.5 & 0.5 \\ 2 & 0 & 0 & 1 \\ \end{array} $$

If we let $\phi(i)$ be the expected number of flips to go from state $i$ to state 2, then from this transition matrix we must have:

$\phi(0) = 0.5*(1 + \phi(0)) + 0.5*(1+\phi(1)) + 0*(1+\phi(2))$ $\phi(1) = 0*(1 + \phi(0)) + 0.5*(1+\phi(1)) + 0.5*(1+\phi(2))$ $\phi(2) = 0*(1 + \phi(0)) + 0*(1+\phi(1)) + 1*\phi(2)$

Por lo que, obviamente, $\phi(2)=0$ y conectando en la primera de dos ecuaciones da el mismo sistema a resolver, como en las otras respuestas.

La solución para $\phi(0)$ da $\phi(0) = 4$.

"¿Por qué" lo hace solamente requieren de 4 volteretas en la expectativa de que lo hacen diferente de los 6 lanzamientos necesarios a la expectativa para ver HH o TT? Si la moneda es justo, entonces, de dos flip secuencia, HH, HT, TH, TT son todos igualmente probables, por lo que no debería tomar la misma cantidad de "tiempo" antes de esperar a ver cualquier uno de los dos flip-patrones?

No. En primer lugar, ya hemos calculado y las expectativas son diferentes. A menos que nuestro modelo de la situación que está mal, entonces 4 es simplemente la respuesta, incluso si no "siente" a la derecha. En segundo lugar, sin embargo, existe una importante asimetría en los dos problemas.

Cuando se busca HH, tendríamos una matriz de transición como esta:

$$ \begin{array}{c|ccc} & 0 & 1 & 2 \\ \hline 0 & 0.5 & 0.5 & 0 \\ 1 & 0.5 & 0 & 0.5 \\ 2 & 0 & 0 & 1 \\ \end{array} $$

The difference is the second row. Instead of being able to stick around indefinitely in state 1, we are immediately faced with either succeeding (getting that second H) or failing and being forced to start over.

This means, on average, it should take longer in the HH case to reach the success state 2 from the middle state 1 than in our original problem. But the probability of going from the start state 0 to the middle state 1 remains identical between the two problems.

So we should expect that it takes longer on average to see the first HH than to see the first HT.

An interesting exercise would be to ask: is there a biased coin of some kind for which the expected number of flips to see HH is the same as the expected number of flips to see HT?

I decided to go ahead and work this one out assuming that $p$ represents the probability of the coin landing on Heads on a certain flip. You can modify the above two transition matrices to use $p$ and $1-p$ in the appropriate places, get the system of equations in each case (the HH case or the HT case) and then solve.

When I solve this, I get that in general, for a coin with bias $p$ for Heads, it will take on average $1/p + 1/(1-p)$ flips to see HT (this agrees with the answer in the 0.5 case) and it will take $(1+p)/p^2$ flips in the HH case, again agreeing with previous calculations for the 0.5 case.

This leads to an equation for $p$:

$\frac{1}{p} + \frac{1}{1-p} = \frac{1+p}{p^2}$

and after rearranging and simplifying, it is a polynomial equation:

$0 = 1 - p - p^2$

que tiene raíces: 0.61803399, -1.618003399, el primero de los cuales puede servir como válido el parámetro bias una moneda.

Así, si alguna vez encuentro una moneda con probabilidad de Jefes de 0.61803399, entonces en ese caso va a ser cierto que, en promedio, se tarda como muchos voltea a ver la primera aparición de HH como lo hace a la primera aparición de la hta.

14voto

DiGi Puntos 1925

Considere la cadena de lanzamientos que preceden a la primera HT. Si alguna vez hay un H en esa cadena, cada sacudida después de eso (pero dentro de la cadena) también debe ser H. por Lo tanto, si hay $m$ tiros antes de la primera HT, deben tomar la forma $T^kH^{m-k}$ algunos $k\in\{0,\ldots,m\}$. Hay, por tanto, exactamente $m+1$ posibilidades de esta cadena inicial de la longitud de la $m$. Si la primera HT es completado en lanzar $n$,$m=n-2$, y $n-1$ posibilidades para la cadena inicial, cada uno de los que ocurren con una probabilidad de $\left(\frac12\right)^{n-2}$, suponiendo una moneda. El total de la probabilidad de terminar el primer HT en lanzar $n$ por lo tanto $(n-1)\left(\frac12\right)^n$, y desea

$$\sum_{n\ge 2}n(n-1)\left(\frac12\right)^n\;.$$

Si $f(x)=\frac1{1-x}$ $|x|<1$ tenemos $f(x)=\sum_{n\ge 0}x^n$, por lo que

$$\frac1{(1-x)^2}=f\,'(x)=\sum_{n\ge 1}nx^{n-1}\;.$$

Ahora diferenciar de nuevo y se multiplica por $x^2$:

$$\frac{2x^2}{(1-x)^3}=x^2f''(x)=\sum_{n\ge 2}n(n-1)x^n\;.$$


Tenga en cuenta que la respuesta no es $6$; usted debe tener mal aplicado el método del enlace. Deje $x$ ser el número esperado de lanzamientos, y deje $y$ ser el esperado número adicional de lanzamientos si usted acaba tirado H. a Continuación,

$$x=\frac12(x+1)+\frac12(y+1)\;,$$

y

$$y=\frac12+\frac12(y+1)\;.$$

A continuación,$y=2$, lo $x=\frac12(x+1)+\frac12(3)=\frac{x}2+2$, e $x=4$.

0voto

Kyle Rogers Puntos 116

Su número esperado de lanzamientos es una variable aleatoria que voy a llamar a $W$ "tiempo de espera"; usted quiere encontrar la expectativa $E[W]$.

Vamos a dividir el proceso en dos etapas ("divide y vencerás"). Empezar por darle la vuelta a la moneda varias veces hasta que sale cara; después de la primera cabeza es vidente, vas a voltear hasta que llega hasta la cola. Por lo $W=X+Y$ donde $X$ es el número de lanzamientos hasta e incluyendo el primer jefe, y $Y$ es la cantidad adicional de volteretas hasta que la moneda sale de la cola. Por la linealidad de la expectativa, $E[W]=E[X+Y]=E[X]+E[Y]$. Por otra parte, es claro que $E[Y]=E[X]$, debido a que la segunda etapa es igual que la primera etapa, con las cabezas y las colas de intercambiarse. Por lo $E[W]=2E[X]$.

Búsqueda de $E[X]$ es más fácil de problema, que puede que ya lo han hecho, así que usted sabe que $E[X]=2$; en el caso de que usted acaba de citar el anterior resultado y la conclusión de que $E[W]=4$. De lo contrario, usted puede encontrar $E[X]$ mediante el uso de "indicador de variables". Es decir, vamos a $X_n$ ser la variable aleatoria que toma el valor de $1$ si $X\gt n$ (es decir, la primera $n$ volteretas llegar colas) y $0$ lo contrario. Desde $X_n$ es una variable de Bernoulli, $E[X_n]=P(X_n=1)=(\frac12)^n$. Desde $X=1+X_1+X_2+X_2+\cdots$, se sigue por la linealidad que $$E[X]=1+E[X_1]+E[X_2]+E[X_3]+\cdots=1+\frac12+\frac14+\frac18+\cdots=2.$$

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X