4 votos

¿Cuál es la probabilidad de que ocurra una secuencia específica de 11 dígitos en una secuencia aleatoria de mil millones de dígitos?

Esto no es tarea, en realidad estoy (por favor no me preguntes por qué) preguntándome cuán probable es que algún número de teléfono de 11 dígitos en particular aparezca en los primeros mil millones de dígitos de pi. Mi curso de probabilidad fue hace mucho tiempo, ¡y la idea de crear una simulación de Monte Carlo para descubrir esto parece un poco extrema!

(Y soy consciente de que pi no es un número aleatorio, solo estoy asumiendo que los dígitos están secuenciados de manera aleatoria.)

1 votos

Corrígeme si me equivoco, pero creo que la respuesta está aquí: math.stackexchange.com/questions/314740/…

0 votos

Depende del número de teléfono.

0 votos

@mjqxxxx: ¿En qué depende del número de teléfono?

2voto

mjqxxxx Puntos 22955

El problema es en realidad bastante complicado, y me remitiría al artículo "Un enfoque unificado de las probabilidades de ocurrencia de palabras" (enlace) para un análisis exhaustivo. Pero podemos aproximar el resultado de forma más sencilla.

Tenga en cuenta que el número esperado de ocurrencias (contando superposiciones) es fácil de obtener: hay $N-n+1$ posiciones iniciales posibles, y la probabilidad de una ocurrencia en cada posición es $10^{-n}$, por lo que el número esperado de ocurrencias es exactamente $(N-n+1)10^{-n}$. Para $N=10^9$ y $n=11$, esto es $10^{-2} - 10^{-10} \aproximadamente 0.01$. Así que sabemos que $$ \sum_{i=0}^{\infty}i\cdot p_i = p_1 + 2p_2 + \cdots=p_{\ge 1}+p_{\ge 2}+\cdots=(N-n+1)10^{-n}, $$ donde $p_i$ es la probabilidad de exactamente $i$ ocurrencias y $p_{\ge i}$ es la probabilidad de al menos $i$ ocurrencias. En particular, tenemos este resultado exacto: $$ p_0=1-p_{\ge 1}=1-(N-n+1)10^{-n}+p_{\ge 2}+p_{\ge 3}+\cdots. $$ Vemos que la probabilidad de que no haya ninguna ocurrencia aumenta, quizás sorprendentemente, junto con la probabilidad de que haya múltiples ocurrencias. Ahora, en su caso $N\gg n$, por lo que podemos ignorar en gran medida la existencia de una ocurrencia cuando buscamos otra: cualquier par es casi seguro que estará muy separado, por lo que la probabilidad de cualquier par es aproximadamente $\frac{1}{2}(0.01)^2$, dando $$ p_0 \aproximadamente 1 - 0.01 + \frac{1}{2}(0.01)^2=0.99005. $$ Sin embargo, hay dos excepciones derivadas de los números de teléfono que se superponen. Si el número de teléfono consiste en un solo dígito (1-111-111-1111), entonces dada una ocurrencia, la probabilidad de una recurrencia inmediata es $10^{-1}$. Esto hace que $p_{\ge 2}\approx 10^{-3}$ en su lugar (veinte veces más grande de lo normal), por lo tanto $p_0\approx 0.991. De manera similar, si el número de teléfono consiste en un par de dígitos en repetición (1-212-121-2121), entonces una recurrencia inmediata tiene una probabilidad de $10^{-2}$. Esto se combina con la probabilidad (comparable) de una segunda ocurrencia independiente para dar $p_{\ge 2}\approx 1.5\times 10^{-4}$ (tres veces mayor de lo normal), por lo tanto $p_0\approx 0.99015. (Los números de teléfono que se superponen a intervalos más largos, como 1-213-121-3121, también son ligeramente menos propensos a ocurrir, pero el efecto es lo suficientemente pequeño como para ser ignorado.)

0voto

Avraham Puntos 2126

Haciendo la suposición simplificadora de que los números de teléfono de 11 dígitos pueden tener cualquier dígito en cualquier lugar, es justo menos del $1\%$ (aproximadamente $0.9951046\%$).

Hay $10^{11}$ posibles "números de teléfono", solo uno de los cuales es el número "mágico", por lo que la probabilidad de no ver el número de teléfono para cualquier cadena de 11 dígitos es $\frac{10^{11} - 1}{10^{11}}$. Sin embargo, con mil millones de dígitos, hay $10^9 - 11 = 999999989$ lugares para que esta cadena tenga que no ocurrir. Entonces obtenemos: $$ \begin{align} &1 - \left(\frac{10^{11} - 1}{10^{11}}\right)^{999999989}\\ &=\large 1 - e^{999999989\left(\log(10^{11} - 1) - \log(10^{11})\right)}\\ &\approx 1- e^{-0.01000089}\\ &\approx 1-0.99049\\ &\approx 0.009951046 \end{align} $$

1 votos

¿Tenemos que asumir que el contenido de cada subcadena de 11 dígitos de $\pi$ es independiente, o simplemente eso no cambia nada? De hecho, me pregunto, ¿podemos afirmar que $P($el número no comienza en la posición $i$ Y no en la posición $i + 1) = P($el número no comienza en la posición $i)^2$?

2 votos

Ten cuidado, algunas cadenas son más probables que otras

0 votos

@vonbrand para los números de teléfono, sí; como números aleatorios de 11 dígitos desde 00000000000 hasta 999999999999, hay exactamente $10^{11}$ de ellos, ya que el orden importa.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X