Yo propondría un enfoque alternativo -tal vez más fácil-, tratando de dar una fórmula que proporcione una respuesta generalizada para la probabilidad de tres eventos seguidos, dada la probabilidad $p $ de que se produzca el evento, en función del tamaño de la muestra $n$ . Como se muestra a continuación, este enfoque también puede ser útil para determinar una cuestión adicional de este problema destacada en uno de los comentarios, es decir, el tamaño de la muestra necesario para "garantizar" un éxito con un nivel de confianza determinado.
Llamemos $P (n) $ la probabilidad de que nuestro evento ocurra tres veces seguidas dentro de una secuencia de $n $ ensayos. Además, para cada ensayo, denotamos como Y el caso en el que se produce nuestro evento, y como N el caso en el que no se produce. Así, en el caso concreto descrito en el PO, buscamos la probabilidad de obtener un triple YYY en una secuencia de $n $ elementos cuando $p=0.7$ .
Como regla general, podemos observar que, pasando de un tamaño de muestra $n $ a un tamaño de muestra $n+1$ la probabilidad de que nuestro evento ocurra tres veces seguidas aumenta sólo porque existe la posibilidad de que el triple YYY, no obtenido en la primera $n $ ensayos, se produce como un triple final en la secuencia de $n+1$ ensayos. Por lo tanto, para calcular $P (n+1 )$ de $ P (n) $ simplemente tenemos que añadir la probabilidad de que el triple de una fila no se obtenga hasta una secuencia final NYYY. Nótese que la N que precede al triple YYY es estrictamente necesaria para satisfacer la condición de que el triple no se haya obtenido en la primera $n $ ensayos.
Entonces podemos empezar con $n=3$ para lo cual tenemos trivialmente $P (3)=p^3$ . Para $n=4$ tenemos que añadir a $P (3) $ la probabilidad de obtener una secuencia NYYY, es decir, tenemos que sumar $p^3(1-p)$ . Del mismo modo, para $n=5$ tenemos que añadir a $P (4) $ la probabilidad de obtener una secuencia final NYYY (nótese que esto no se ve afectado por lo que ocurra en el primero de los cinco ensayos), lo que significa que debemos sumar $p^3(1-p)$ como en el caso anterior. Por último, para $n=6$ tenemos que añadir de nuevo a $P (5) $ la probabilidad de obtener una secuencia final NYYY (nótese que, como en el caso anterior, esto no se ve afectado por lo que ocurre en el primero y en el segundo de los seis ensayos). Esto lleva a un aumento adicional de $p^3(1-p)$ . Así, para este grupo inicial de cuatro valores de en nuestra progresión de probabilidad, obtenemos directamente la recurrencia
$$P (n+1)=P (n)+ p^3 (1-p)\,\,\,\, \text {(for n=3 to 6)}$$
En consecuencia, para el caso concreto $p=0.7$ esta fórmula da los valores iniciales
\begin{aligned} P(3) & =0.7^3=0.343 \\ P (4) & = 0.7^3+0.3 \cdot 0.7^3 = 0.4459 \\ P (5) & = 0.7^3+2\cdot 0.3 \cdot 0.7^3 = 0.5488 \\ P (6) & = 0.7^3+3\cdot 0.3 \cdot 0.7^3 = 0.6517 \\ \end{aligned}
ya obtenida en una respuesta anterior a través de un método diferente.
Consideremos ahora los valores de $n \geq 7$ . Aquí algo cambia, porque el hecho de que la secuencia termine con NYYY no implica que la triple YYY no se haya producido antes, es decir, en la primera $n-4$ ensayos. Así, en cada paso, la probabilidad de obtener un NYYY final debe multiplicarse por la probabilidad de fracaso en el primer $n-4$ ensayos, que es $1-P (n-4 ) $ . Por lo tanto, para $n=7$ tenemos que añadir a $P (6) $ la probabilidad dada por $p^3(1-p) [1-P(3)]\,\,$ , para $n=8$ tenemos que añadir a $P (7) $ la probabilidad dada por $p^3(1-p) [1-P(4)] \,\, $ y así sucesivamente. Esto lleva a la recurrencia
$$P (n+1)=P (n)+ p^3(1-p)[1-P(n-4)]\,\,\,\, \text{(for n}\, \geq \text {7)}$$
Ahora podemos intentar obtener una forma cerrada para esta última recurrencia. Establezcamos, por simplicidad, $p^3=j$ y $(1-p) =k \,\, $ . La recurrencia se convierte en
$$P (n+1)=P (n)+ jk-jk \,P(n-4)\, \,$$
Obsérvese que los cuatro valores de $P (n)$ ya determinado puede escribirse como $$P (3)=j $$ $$P (4)=j +jk$$ $$P (5)=j +2jk$$ $$P (6)=j +3jk$$
de manera que sólo contengan términos de grado $j $ o $jk $ . Continuando con nuestra progresión de probabilidades y centrándonos en el segundo grupo de cuatro valores de $n$ (de $n=7\,\, $ a $n=10 \,\, $ ), nuevos términos de grado $j^2k $ y $j^2k^2$ aparecen aplicando la recurrencia anterior (en aras de la legibilidad, aquí proporciono directamente las expresiones resultantes evitando los tediosos cálculos paso a paso):
\begin{aligned} P (7) & = P(6)+ jk-jk P (3)=j+4jk-j^2k \\ P (8) & = P(7)+ jk-jk P (4)= j+ 5jk -2j^2k-j^2k^2 \\ P (9) & = P(8) + jk-jk P (5)= j+ 6jk -3j^2k-3j^2k^2 \\ P (10) & = P (9) + jk-jk P (6)= j+ 7jk -4j^2k-6j^2k^2 \\ \end{aligned}
Empieza a surgir algún patrón en estas expansiones. Para el caso concreto $p=0.7$ , $$P (7)\approx 0.7193$$ $$P (8)\approx 0.7763$$ $$P (9) \approx 0.8228$$ $$P (10) \approx 0.8586$$
Podemos repetir el procedimiento, aplicando la misma recurrencia y continuando con el tercer grupo de cuatro valores de $n $ (es decir, $n=11$ a $14$ ). De nuevo aparecen nuevos términos, en este caso de grado $j^3k^2$ y $j^3 k^3$ (como en el caso anterior, proporciono directamente las expresiones resultantes):
\begin{align*} P(11) &=j+8jk-5j^2k-10j^2k^2+j^3k^2 \\ P(12) &=j+9jk-6j^2k-15j^2k^2+3j^3k^2+j^3k^3 \\P(13) & = j+10jk-7j^2k -21j^2k^2+6j^3k^2+4j^3k^3 \\ P (14) & = j+11jk-8j^2k-28j^2k^2+10j^3k^2+10j^3k^3\\ \end{align*}
Por lo tanto, el patrón final es el siguiente. Nuestras expansiones de $P (n) $ incluyen:
-
en las posiciones de impar, $\lfloor (n+1)/4 \rfloor \,\, $ términos de la forma $$(-1)^{i-1} \binom{n-3i}{i-1} j^i k^{i-1} \,\, $$ donde $$i=1,2... \lfloor (n+1)/4 \rfloor \,\, $$ Por ejemplo, en la ampliación de $P (14)$ hay $ \lfloor (14+1)/4 \rfloor =3 \, \,\, $ términos de este formulario, que son $j $ , $-8j^2k $ y $10 j^3k^2$ ;
-
en las posiciones pares, $\lfloor n/4 \rfloor \,\, $ términos de la forma $$(-1)^{i-1} \binom{n-3i}{i} j^i k^i \,\, $$ donde $$i=1,2... \lfloor n/4 \rfloor$$
En consecuencia, tomando de nuevo como ejemplo la expansión de $P (14)$ Hay $ \lfloor 14/4 \rfloor =3 \,$ términos de este formulario, que son $11jk$ , $-28j^2k^2$ y $10 j^3k^3$ .
Por lo tanto, obtenemos la siguiente expresión general para $P (n) $ :
$$P (n)=\sum_{i}^{\lfloor (n+1)/4 \rfloor } (-1)^{i-1} \binom{n-3i}{i-1} j^{i}k^{i-1} +\sum_{i}^{\lfloor n/4 \rfloor } (-1)^{i-1} \binom{n-3i}{i} j^i k^i $$
Recordando que $j=p^3$ y $k=(1-p) $ Finalmente conseguimos
$$P (n)=\sum_{i}^{\lfloor (n+1)/4 \rfloor } (-1)^{i-1} \binom{n-3i}{i-1} p^{3i}(1-p)^{i-1} + \sum_{i}^{\lfloor n/4 \rfloor } (-1)^{i-1} \binom{n-3i}{i} p^{3i} (1-p)^i $$
Configuración $p=0.7$ obtenemos la probabilidad que se pide en el PO, que es
$$P (n)=\sum_{i}^{\lfloor (n+1)/4 \rfloor } (-1)^{i-1} \binom{n-3i}{i-1} 0.7^{3i} \cdot 0.3^{i-1} + \sum_{i}^{\lfloor n/4 \rfloor } (-1)^{i-1} \binom{n-3i}{i} 0.7^{3i}\cdot 0.3^i $$
Obsérvese también que las dos sumas tienen el mismo número de términos cuando $n \not\equiv -1 \,\, \text {mod}\,\, 4$ mientras que la primera suma tiene un término más que la segunda cuando $n \equiv -1 \,\,\text {mod} \, 4$ porque en este caso $(n+1)/4$ es un número entero. Este término viene dado por
$$\displaystyle (-1)^{\frac{(n+1)}{4}-1} \binom{n-\frac{3(n+1)}{4}}{ \frac{(n+1)}{4}-1}\, 0.7^{\frac{3(n+1)}{4}} \, 0.3^{\frac{(n+1)}{4}} $$ $$\displaystyle = (-1)^{\frac{(n-3)}{4}} \binom{\frac{(n-3)}{4}}{\frac{(n-3)}{4}}\, 0.7^{\frac{3(n+1)}{4}} \, 0.3^{\frac{(n+1)}{4}} $$ $$\displaystyle = (-1)^{\frac{(n-3)}{4}} \, 0.7^{\frac{3(n+1)}{4}} \, 0.3^{\frac{(n+1)}{4}} $$
Por lo tanto, la probabilidad planteada en el PO puede expresarse alternativamente como
$$P (n)=\sum_{i}^{\lfloor n/4 \rfloor } (-1)^{i-1} \binom{n-3i}{i}\, 0.7^{3i}\, 0.3^{i} \left( \frac {i}{0.3(n-4 i+1)} +1 \right) + S$$
donde
$$S = \begin{cases} 0 & \mbox{if } n \not\equiv -1 \, \text {mod}\, 4\\ (-1)^{\frac{(n-3)}{4}} \, 0.7^{\frac{3(n+1)}{4}} \, 0.3^{\frac{(n+1)}{4}} & \mbox{if } n \equiv -1 \, \text {mod}\, 4 \end{cases}$$
También se pudo observar que $|S|$ es relativamente pequeño y disminuye rápidamente al aumentar $n$ su valor es $\approx 0.0106\, \,\, $ para $n=7$ , convirtiéndose en $\approx 0.00109\, \,\, $ para $n=11$ y $\approx 0.000112\,\,\, $ para $n=15$ de modo que su contribución a la probabilidad global es casi despreciable. La última expansión sin el $S$ puede considerarse una aproximación válida incluso para el caso $n \equiv -1 \, \text {mod}\, 4$ .
La probabilidad de tres eventos seguidos dada por estas fórmulas para $p=0.7$ y $n=3$ a $10$ ya se han proporcionado anteriormente. Como se esperaba, para aumentar $n $ El valor de $P (n)$ se acerca a $1$ . El primer valor para el que la probabilidad alcanza $95\%$ es $n=15$ ya que $P (15) \approx 0.9553\,\,\, $ según ha confirmado WA aquí%200.7%5E(3i)%200.3%5Ei%20(i%2F(0.3(15-4%20i%2B1))%2B1)%20%20%20),%7Bi,%2015%2F4%7D%5D) . La probabilidad alcanza $97.5\%$ y $99\%$ para $n=18$ y $n=22$ respectivamente, ya que $P(18) \approx 0.9772\,\,\, $ y $P(22) \approx 0.9909\,\,\, $ según ha confirmado WA aquí%200.7%5E(3i)%200.3%5Ei%20(i%2F(0.3(18-4%20i%2B1))%2B1)%20%20%20),%7Bi,%2018%2F4%7D%5D) y aquí%200.7%5E(3i)%200.3%5Ei%20(i%2F(0.3(22-4%20i%2B1))%2B1)%20%20%20),%7Bi,%2022%2F4%7D%5D) .
1 votos
En caso de que sean exactamente tres eventos, denotados por $1$ por ejemplo $00011100$ o bien $01111000$ o $1110111$ ¿también cuenta?
0 votos
Todos cuentan. Aunque, mientras tres ocurran consecutivamente no nos importa el resto. Para n muy grande la probabilidad debería acercarse a 1, ¿correcto? Si se puede encontrar una generalización podría encontrar el tamaño de n que casi garantiza un éxito.
0 votos
Esto se ha preguntado varias veces aquí. Ver por ejemplo math.stackexchange.com/questions/514103/ math.stackexchange.com/questions/4658/
0 votos
Hola Vincent, he dado una respuesta alternativa a tu pregunta, para proporcionar una fórmula general para la probabilidad en función del tamaño de la muestra.