9 votos

Probabilidad de que una secuencia se repita

Dada una secuencia infinita $a_n$ de enteros uniformemente aleatorios $0$ a $9$ ¿Cuál es la probabilidad de que exista un número entero $m$ tal que la secuencia $a_1$ a $a_m$ es igual a la de $a_{m+1}$ a $a_{2m}$ ?

¿Y si nos limitamos a dos símbolos, o $k$ ¿símbolos?

5voto

JiminyCricket Puntos 143

No puedo dar una respuesta exacta, pero sí una conexión interesante y algunos resultados numéricos.

Un poco de práctica con ejemplos cortos muestra que los eventos para diferentes números enteros $m$ son casi pero no exactamente independientes. Por ejemplo, algunas secuencias que no se repiten en $m=3$ repetir en $m=2$ pero no en $m=1$ mientras que para las secuencias que sí se repiten en $m=3$ repetición en $m=2$ implica la repetición en $m=1$ . Sin embargo, el efecto de la dependencia parece bastante pequeño, por lo que

$$ \prod_{m=1}^\infty(1-k^{-m}) $$

debería ser una buena aproximación a la probabilidad de que no haya repetición. Por cierto, si $k$ es una potencia prima, es la probabilidad de que una gran matriz cuadrada aleatoria sobre $\mathbb F_k$ es invertible; véase Probabilidad de que una matriz binaria aleatoria sea invertible . En esa respuesta, calculé el producto para $k=2$ para ser aproximadamente $0.288788$ , lo que haría que la probabilidad de que una secuencia binaria presente repetición sea aproximadamente $0.711212$ .

Estos son los resultados numéricos para $k=2$ para las repeticiones hasta $m=17$ . Cada fila contiene el número de cadenas de longitud $2m$ que se repiten, el número de cadenas que no se repiten, la proporción $p_m$ de cadenas que se repiten, y un valor $\alpha_m=-\log_2(1-(1-p_m)/(1-p_{m-1}))$ que sería $m$ si la repetición en $m$ eran independientes de las repeticiones anteriores ( aquí está el código ):

$$ \begin{array}{rrrlr} m&\text{repeating}&\text{non-repeating}&\text{proportion}&\alpha_m\\\hline 1 & 2 & 2 & 0.5 & 1.00000\\ 2 & 10 & 6 & 0.625 & 2.00000\\ 3 & 44 & 20 & 0.6875 & 2.58496\\ 4 & 182 & 74 & 0.7109375 & 3.73697\\ 5 & 738 & 286 & 0.720703125 & 4.88753\\ 6 & 2972 & 1124 & 0.7255859375 & 5.83794\\ 7 & 11924 & 4460 & 0.7277832031 & 6.96450\\ 8 & 47768 & 17768 & 0.7288818359 & 7.95290\\ 9 & 191214 & 70930 & 0.7294235229 & 8.96725\\ 10 & 765136 & 283440 & 0.7296905518 & 9.98483\\ 11 & 3061104 & 1133200 & 0.7298240662 & 10.98340\\ 12 & 12245530 & 4531686 & 0.7298904657 & 11.99044\\ 13 & 48984342 & 18124522 & 0.7299235761 & 12.99397\\ 14 & 195941804 & 72493652 & 0.7299401015 & 13.99640\\ 15 & 783776080 & 289965744 & 0.7299483567 & 14.99761\\ 16 & 3135122038 & 1159845258 & 0.7299524820 & 15.99838\\ 17 & 12540523572 & 4639345612 & 0.7299545438 & 16.99901\\ \end{array} $$

El acuerdo con $0.711212$ está bien pero no es una maravilla. Como sugiere el $m=3$ la dependencia aumenta ligeramente la probabilidad de repetición porque una repetición implica correlaciones entre las condiciones de repetición a valores inferiores de $m$ pero este efecto es más fuerte en $m=3$ y se vuelve insignificante a valores más altos de $m$ , donde $\alpha_m\approx m$ muestra que casi exactamente la proporción esperada de secuencias se repite por primera vez. Por tanto, podemos obtener una estimación precisa de la probabilidad límite a partir de $p\approx p_{17}+(p_{17}-p_{16})\approx0.7299566056$ que debería tener una precisión de ocho o nueve dígitos.

He comprobado en OEIS las secuencias de los recuentos que se repiten y los que no se repiten; no hay resultados.

P.D.: Hay que tener en cuenta que, como ha señalado t.b. en un comentario bajo la respuesta enlazada anteriormente, por el teorema del número pentagonal el producto anterior viene dado por

$$ \begin{align} \prod_{m=1}^\infty(1-k^{-m})&=\sum_{j=-\infty}^\infty(-1)^jk^{-j(3j-1)/2)}\\&=1-k^{-1}-k^{-2}+k^{-5}+k^{-7}-k^{-12}-k^{-15}+k^{-22}+k^{-26}-\dotso\;, \end{align} $$

lo que lleva a un interesante patrón de dígitos en su representación en base $k$ :

$$ \begin{align} \prod_{m=1}^\infty(1-2^{-m})&=0.01001001111011100000010000111111110111110000000000100\ldots_2\;, \\ \prod_{m=1}^\infty(1-10^{-m})&=0.89001009999899900000010000999999998999990000000000100\ldots_{10}\;. \end{align} $$

-4voto

ACarter Puntos 125

(No soy un experto en esto (soy un novato), pero de repente se me ocurrió algo al leer la pregunta, puede que esté mal)

Suponiendo que $_m$ es una constante:

Dependerá de lo grande que sea $_m$ es. Si el $_m = 1$ entonces la probabilidad sería $\frac1{10}$ . Si $_m = 2$ entonces $\frac1{100}$ . (es decir, si tuviera $19$ como los dos primeros, hay $100$ posibilidades de las dos segundas, por lo que la probabilidad de $19$ que viene es $\frac1{100}$ .

Por lo tanto, la probabilidad es $$\frac1{10^m}$$

Si $_m$ puede ser cualquier número:

Entonces..... No sé cómo resolverlo. (A menos que de repente tenga una idea...)

(Esta es mi primera respuesta, me gusta el mathjax).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X