11 votos

Probabilidad de $n$ éxitos consecutivos en la $k$ -enésimo ensayo Bernoulli... ¿geométrico?

Si se tienen ensayos Bernoulli con probabilidad de éxito $p$ entonces tiene sentido que la probabilidad del primer éxito observado sea en el ensayo número $k$ viene dada por

$$(1-p)^{k-1} p.$$

Pero ¿cómo enfocaríamos el mismo problema si la probabilidad que buscamos es la probabilidad de obtener el primer suceso de dos aciertos seguidos en el $k$ -¿Enésimo juicio? En otras palabras, para el ensayo $k$ ser un éxito, con ensayos $k-1$ y sin que antes se hayan producido dos éxitos seguidos? En general, ¿qué ocurre si queremos que el primer $n$ ¿éxitos seguidos? Puedo hacerlo contando si $p = 1/2$ pero mi argumento de recuento (un requisito sobre la secuencia de primeros $k-3$ juicios, además de imponer el fracaso en la $k-2$ y luego imponer dos aciertos seguidos) se rompe si $p \neq 1/2$ . Esto no debería ser demasiado difícil, ya que parece muy similar en naturaleza a la distribución geométrica.

Gracias.

0 votos

"sin ningún otro caso de dos éxitos seguidos antes". Esa es la parte más complicada.

0 votos

Yo había hecho una pregunta similar aquí : stats.stackexchange.com/q/303960/119261 .

29voto

Martin OConnor Puntos 116

Un análisis de la $n=2$ a continuación. Permítanme explicar por qué el general $n$ caso va a ser feo, rozando lo imposible.

Sea $P_k$ denotan la probabilidad de que $n$ se producen éxitos consecutivos en el juicio $k$ por primera vez. Desde que ver un fallo "reinicia" el proceso, $P_k$ debe satisfacer la siguiente relación de recurrencia para $k > n$ :

$$P_k = q P_{k-1} + pq P_{k-2} + p^2 q P_{k-3}+ \cdots + p^{n-1} q P_{k-n}.$$ Se trata de un $n$ ecuación en diferencias lineales de segundo orden con coeficientes constantes. Por lo tanto su solución es de la forma $P_k = \sum_{i=1}^n c_i r_i^k$ donde el $r_i$ s son las raíces de la ecuación $$x^n - q x^{n-1} - pq x^{n-2} - \cdots - p^{n-1} q = 0.$$ Por tanto, una forma explícita para $P_k$ nos obligaría a resolver esta ecuación para general $p$ y $q$ . No es probable que esto sea posible de forma cerrada. De hecho, como veremos a continuación, el caso en que $n=2$ ya se pone bastante feo. La relación de recurrencia con las condiciones iniciales $P_0 = P_1 = \cdots = P_{n-1} = 0, P_n = p^n$ puede ser lo mejor que podamos hacer.


( Respuesta original. ) Para el $n = 2$ caso, que $X$ denota la prueba en la que vemos por primera vez el segundo éxito consecutivo. Sea $P_k$ denotan $P(X=k)$ . Voy a dar

  1. Una expresión exacta para $P_k$ a través de la solución de una recurrencia para $P_k$ ,
  2. Una expresión de suma binómica para $P_k$ mediante un argumento combinatorio,
  3. La función generadora de probabilidad $G(z)$ para $X$ ,
  4. $E[X]$ y
  5. $Var[X]$ .

El método utilizado para hallar la expresión exacta de $P_k$ y el método para encontrar la función generadora de probabilidad puede extenderse a la general $n$ caso, pero esto se pondrá cada vez más feo a medida que $n$ aumenta.


Expresión 1. Dado que, salvo SS, cualquier secuencia contabilizada bajo $P_k$ debe empezar por F o por SF, tenemos la relación de recurrencia $P_k = q P_{k-1} + pq P_{k-2}$ para $k \geq 3$ con condiciones iniciales $P_0 = P_1 = 0$ , $P_2 = p^2$ . Se trata de un ecuación lineal en diferencias de segundo orden con coeficientes constantes por lo que la solución es $P_k = A r_1^k + B r_2^k,$ donde $r_1$ y $r_2$ son las raíces de la ecuación auxiliar $x^2 - q x - pq = 0$ y $A$ y $B$ se encuentran a través de las condiciones iniciales. Examinando el álgebra, obtenemos, para $k \geq 1$ , $$P_k = \frac{p^2\left(\left(q + \sqrt{q^2+4pq}\right)^{k-1} - \left(q - \sqrt{q^2+4pq}\right)^{k-1}\right)}{2^{k-1}\sqrt{q^2+4pq}}.$$

Tenga en cuenta que si $p = q = \frac{1}{2}$ la recurrencia se reduce a $P_k = \frac{1}{2} P_{k-1} + \frac{1}{4} P_{k-2}$ . Así, para $k \geq 1$ , $P_k = \frac{F_{k-1}}{2^k}$ donde $F_k$ es el $k$ número de Fibonacci.


Expresión 2.

Sabemos que las dos últimas pruebas tienen que ser un éxito. Supongamos, entonces, que hay $j$ éxitos en la primera $k-2$ ensayos. Dado que cada uno de estos $j$ éxitos deben ir seguidos de un fracaso, necesitamos el número de formas de colocar $j$ veces en $k-2$ ubicaciones a $p$ seguido de un $q$ . Desde $pq$ deben tratarse como un par, sin embargo, esto equivale al número de maneras de colocar $j$ elementos individuales en $k-2-j$ lugares. El número de formas de hacerlo es $\binom{k-2-j}{j}$ por lo que la probabilidad de que haya $j$ éxitos en la primera $k-2$ ensayos seguidos de éxitos en los dos últimos ensayos es $p^2 \binom{k-2-j}{j} (pq)^j q^{k-2-2j} = p^2 \binom{k-2-j}{j} p^j q^{k-2-j}$ . Sumando todos los valores posibles de $j$ nos da $$P_k = p^2 \sum_{j = 0}^{k-2} \binom{k-2-j}{j} p^j q^{k-2-j}.$$

Si $p = q = \frac{1}{2}$ tenemos, una vez más, $P_k = \frac{1}{2^k} \sum_{j = 0}^{k-2} \binom{k-2-j}{j} = \frac{F_{k-1}}{2^k}$ , donde el último paso se deduce de la propiedad "suma de las diagonales poco profundas" del triángulo de Pascal. (Véase MathWorld entrada sobre el triángulo de Pascal , Ec. 16.)


La función generadora de probabilidad, el valor esperado y la varianza.

También podemos encontrar el función generadora de probabilidad . Esto es $$G(z) = \frac{p^2 z^2}{1-qz-pqz^2}.$$

Una propiedad básica de las funciones generadoras de probabilidad dice que $P_k$ puede calcularse mediante $P_k = G^{(k)}(0)/k!$ .

Si $p = q = \frac{1}{2}$ entonces tenemos $G(z) = \frac{(z/2)^2}{1-(z/2)-(z/2)^2} = z/2 F(z/2)$ donde $F(z) = \frac{z}{1-z-z^2}$ la función generadora de los números de Fibonacci. Así, una vez más, vemos que $P_k = \frac{F_{k-1}}{2^k}$ en este caso.

Para derivar la función generadora, considere la "suma infinita" de formas posibles de obtener dos aciertos seguidos en los dos últimos ensayos: $$SS + FSS + FFSS + SFSS + FFFSS + FSFSS + SFFSS + \cdots.$$

Dado que, hasta las dos últimas pruebas, una F puede ir seguida de una S o de una F, mientras que una S debe ir seguida de una F, cada término de esta suma puede descomponerse unívocamente en el producto de términos elegidos entre {F, SF} seguidos de SS. Así, podemos expresar (formalmente) esta suma infinita como $$\sum_{k=0}^{\infty} (F + SF)^k SS = \frac{SS}{1 - F - SF}.$$ En $S = pz$ y $F = qz$ (es decir, contar un ensayo por cada éxito y uno por cada fracaso) da la función generadora $G(z)$ .

Por último, podemos utilizar la función generadora de probabilidad para calcular los momentos. Por ejemplo, como el valor esperado es $G'(1^-)$ y la varianza es $G''(1^-) + G'(1^-) - [G'(1^-)]^2$ un poco de cálculo y mucha simplificación muestran que $$E[X] = \frac{1}{p^2} + \frac{1}{p}$$ y $$Var[X] = \frac{1}{p^4} + \frac{2}{p^3} - \frac{2}{p^2} - \frac{1}{p}.$$

0 votos

Vaya, esto era mucho más difícil de lo que pensaba. Una solución de función generadora muy inteligente, ¡gracias!

1 votos

No puedo creer que esta respuesta sólo tenga 3 upvotes...

0voto

cbrmn Puntos 1

Para cualquier n, la respuesta exacta puede encontrarse en los siguientes documentos

Evgeny Khorov, Anton Kiryanov, Andrey Lyakhov, Dmitry Ostrovsky. Estudio analítico de Neighborhood Discovery y Link Management en OLSR. //IFIP Wireless Days 2012, Dublín, 2012. http://www.gta.ufrj.br/ftp/gta/TechReports/wd2012/1569655727.pdf

Evgeny Khorov, Anton Kiryanov, Andrey Lyakhov, Alexander Safonov. Estudio analítico de la gestión de enlaces en redes malladas IEEE 802.11s //International Symposium on Wireless Communication Systems (ISWCS). Francia, 2012. P. 786-790 http://khorov.iitp.ru/eng/science/papers/2012-khorov-mpmp.pdf

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X