Creo que los fenómenos que observas se explican más por la forma en que construyes $B_0$ y $B_1$ que por las propiedades de los primos (aunque las propiedades de los primos parecen desempeñar un papel). Si en cambio suponemos que $b_i$ fueran aleatorios, obtenidos mediante el lanzamiento de una moneda, es fácil ver que para cada bit de $B_0$ o $B_1$ la probabilidad de que el siguiente bit sea el mismo es $\frac{1}{3}$ y la probabilidad de que el siguiente bit sea diferente es $2/3$ .
En efecto, digamos $b_i \equiv i \mod 2$ para algunos $i$ Así que en el momento $i$ acabamos de añadir $b_i$ a $B_0$ .
Entonces, si el siguiente $k-1$ bits no son congruentes con su posición mod $2$ , seguido por el $k$ a su posición, $i+k$ , mod. $2$ a continuación añadimos el bit $i+k \mod 2$ a $B_0$ . Esto ocurre con probabilidad $\frac{1}{2^k}$ y en cada secuencia esto ocurre exactamente para un valor de $k$ .
Así que tenemos una parte diferente con probabilidad $\frac{1}{2} + \frac{1}{2^3} + \frac{1}{2^5} + \dots = \frac{2}{3}$ y el mismo bit con probabilidad $\frac{1}{2^2} + \frac{1}{2^4} + \frac{1}{2^6} + \dots = \frac{1}{3}$ . El $B_1$ caso es idéntico.
Así que la probabilidad de obtener $10$ ceros consecutivos a partir de un punto cualquiera es $\frac{1}{2} \cdot \frac{1}{3^9}$ . Sin embargo, el tiempo que esperamos que pase antes de ver la primera tirada de $10$ ceros consecutivos es un poco más larga que la inversa, $3^{10}-1=59048$ por un argumento clásico.
Así que esperamos unas 17 veces más de lo que cabría esperar para encontrar una serie de diez ceros. (Pero había que elegir 4 opciones para encontrar una tirada tan larga sin ceros). Eso no es completamente sorprendente, pero es mucho menos extraño que en el modelo aleatorio ingenuo, donde el tiempo de espera esperado es $2^{11}-1$ , por lo que habrías esperado alrededor de $489$ veces más de lo esperado.
De forma más general, si sustituimos $b_i$ con una cadena de Markov con probabilidad de tomar el mismo valor en pasos adyacentes $p$ entonces la probabilidad de que $B_0$ toma el mismo valor en pasos adyacentes debe ser $$p^2 + p^2(1-p)^2 + p^2 (1-p)^4 + \dots = \frac{ p^2}{ 1- (1-p)^2} = \frac{p^2 }{ 2p -p^2} = \frac{p}{ 2-p}$$ ya que para obtener dos del mismo bit en $B_0$ , $b_i$ debe ser igual o igual-diferente-diferente-igual o igual-diferente-diferente-diferente-igual.
Para explicar $\frac{ p}{2-p} = \frac{1}{2} - .28 = .22$ como en el análisis de dvitek, necesitamos $p= \frac{2}{ 1/.22 +1} =.361$ es decir, hay una discrepancia de aproximadamente $.14$ para explicar en la estadística más natural la frecuencia con la que dos primos adyacentes tienen penúltimos bits distintos.
3 votos
Para su información, un par de preguntas bastante relacionadas son Autocorrelaciones inesperadas en la secuencia de primos módulo 4 y Complejidad verbal de los primos mod 4 .