80 votos

Los matemáticos sorprendió(?) para encontrar el patrón de los números primos

Hay un interesante artículo reciente "Matemáticos sorprendido de encontrar el patrón en "random" los números primos" en la revista New Scientist. (¿No te encantan las matemáticas títulos en la prensa popular? Comparar a la fuente del papel Inesperado Sesgos en la Distribución de los números Primos Consecutivos.)

Para resumir, vamos a $p,q$ ser consecutivos de los números primos de la forma $a\pmod {10}$$b\pmod {10}$, respectivamente. En el papel por K. Soundararajan y R. Oliver, aquí está el número de $N$ (en millones de unidades) de tales pares para los primeros cien millones de números primos modulo $10$,

$$\begin{array}{|c|c|c|c|c|c|c|c|c|c|c|c|c|} \hline &a&b&\color{blue}N&&a&b&\color{blue}N&&a&b&\color{blue}N&&a&b&\color{blue}N\\ \hline &1&3&7.43&&3&7&7.04&&7&9&7.43&&9&1&7.99\\ &1&7&7.50&&3&9&7.50&&7&1&6.37&&9&3&6.37\\ &1&9&5.44&&3&1&6.01&&7&3&6.76&&9&7&6.01\\ &1&1&\color{brown}{4.62}&&3&3&\color{brown}{4.44}&&7&7&\color{brown}{4.44}&&9&9&\color{brown}{4.62}\\ \hline \text{Total}& & &24.99&& & &24.99&& & &25.00&& & &24.99\\ \hline \end{array}$$

Como era de esperar, cada clase $a$ dispone de un total de $25$ millones de números primos (después de redondeo). El "escandaloso" de la cosa, según el artículo, es que si los primos eran verdaderamente al azar, entonces es razonable esperar que cada subclase se han $\color{blue}{N=25/4 = 6.25}$. Como el presente de datos de muestra, este no parece ser el caso.

Argumento: La disparidad parece tener sentido. Por ejemplo, supongamos $p=11$, lo $a=1$ . Desde $p,q$ son números primos consecutivos, entonces, por supuesto, los números subsiguientes no son elegidos al azar. ¿No sería más probable que el próximo primer terminará en el "más cerca" $3$ o $7$ como $q=13$ o $q=17$, en lugar de regresar a la misma final dígitos, como $q=31$? (Me he tomado la libertad de re-organización de la mesa para reflejar esto.)

Sin embargo, lo que es sorprendente es el artículo concluye que, y cito, "...como la de los números primos extenderse hasta el infinito, que finalmente sacudir el patrón y darle a la distribución al azar de los matemáticos están acostumbrados a esperar."

Pregunta: ¿Cuál es una manera efectiva para contrarrestar el argumento de arriba y llegar a la misma conclusión que en el artículo? (En otras palabras, todos los $N$ eventualmente enfoque de $N\to 6.25$, con la unidad adecuadamente ajustado.) O es la conclusión basada en una conjetura y no puede ser cierto?

42voto

Jorrit Reedijk Puntos 129

$ \qquad \qquad $ Nota: ver también [actualización 2] al final

1. Primeras observaciones

Creo que hay al menos un artefacto (=no aleatoria) en la lista de frecuencias.

Si podemos reescribir esto como una "correlación"de la tabla, (el encabezado de fila indican los residuos de las clases de los más pequeños primos p y el encabezado de columna de la mayor prime q):
$$ \pequeño \begin{array} {r|rrrr} & 1&3&7&9 \\ \hline 1& 4.62& 7.43& 7.50& 5.44\\ 3& 6.01& 4.44& 7.04& 7.50\\ 7& 6.37& 6.76& 4.44& 7.43\\ 9& 7.99& 6.37& 6.01& 4.62 \end{array}$$ a continuación, una observación sorprendente es sin duda el sorprendente simetría alrededor de la antidiagonal. Pero también el asimétrica aumento de frecuencias a partir de la parte superior derecha a la inferior izquierda de la antidiagonal de alguna manera es sorprendente.

Sin embargo, si nos fijamos en esta tabla en términos de primegaps, entonces

  • residuos de pares $(1,1)$ $(3,3)$ $(7,7)$,$(9,9)$ (la diagonal) se refieren a primegaps de el lenghtes $(10,20,30,...,10k,...)$ y esas son las entradas de la tabla con frecuencias más bajas,
  • residuos de pares $(1,3)$, $(7,9)$ y $(9,1)$ se refieren a primegaps de la lenghtes $(2,12,22,32,...,10k+2,...)$ y los que contienen la entrada con las frecuencias más altas
  • residuos de pares $(3,7)$ $(7,1)$ ,$9,3$ consulte primegaps de la lenghtes $(4,14,24,34,...,10k+4,...)$
  • residuos de pares $(1,7)$ $(3,9)$ y $(7,3)$ se refieren a primegaps de la lenghtes $(6,16,26,36,...,10k+6,...)$ y tener los dos al mayor frecuencias
  • residuos de pares $(1,9)$ $(3,1)$ y $(9,7)$ se refieren a primegaps de la lenghtes $(8,18,28,38,...,10k+8,...)$

por lo que la -en la primera vista sorprendente - diferentes frecuencias de los pares de $(1,9)$ $(9,1)$ se produce porque uno recoge las lagunas de la (mínima) de una longitud de 8 y el otro el de (mínimo) de longitud 2 y el último son mucho más frecuentes, pero que es totalmente compatible con la distribución general de primegaps. Las imágenes siguientes muestran la distribución de la primegaps modulo 100 (cuya mayor número de residuos de clases debe hacer el problema más transparente).

(Me he dejado los números primos menores que 10 fuera de la computación):

image

en escala logarítmica imglog

Vemos un claro logarítmica de la disminución de frecuencias con una pequeña variación de la perturbación sobre el residuo de clases. También es obvio, que el menor primegaps dominar a los más grandes, por lo que un "slot" lo que llama la primegaps de lengthes $2,12,22,...$ tiene más ocurrencias de la "ranura", que las capturas de $8,18,28,...$ - sólo por las frecuencias en el primer residuo de la clase. El original de la tabla de frecuencias en el residuo de clases modulo 10 divide esta en 16 combinaciones de pares de 4 de residuos de clases y el observado no la suavidad es debido a que, en general, la fluctuación en el resdiue clases de la primegaps.

También podría ser interesante ver que primegap frecuencias separadas en tres subclases - :

image

Que trisection muestra de la recogida de residuos de clases $6,12,18,...$ (la línea verde) como dominante sobre las otras dos colecciones y los otros dos de la colección de cambio "prioridad" sobre el único residuo de clases.
El modulo-10-problema superposiciones que se curva un poco y plancha la variación un poco e incluso se hace un poco menos visible, pero no completamente: debido a que la distribución general de los residuos de las clases en el primegaps tiene un fuerte dominio en el pequeño residuo de clases. Así que creo que, en general, la distribución de la característica explica que el modulo-10 problema, sin embargo un poco menos obvio...

2. Observaciones adicionales (actualización 2)

Para un análisis más detallado de los restantes fluctuación en la imagen anterior he tratado de tendencia de las frecuencias de distribución de la primegaps (sin embargo, ahora sin el modulo consideraciones!).
Aquí es lo que tengo en la base de 5 700 000 de los números primos y los primeros 75 distinto de cero lenghtes g. La regresión de la fórmula simplemente fue creado por el Excel-hoja de cálculo: image_trend

De tendencias, medios para calcular la diferencia entre el verdadero frecuencias $\small f(g)$, y la estimación; sin embargo, la frecuencia de los residuos de $\small r_0(g)=f(g) - 16.015 e^{-0.068 g }$ de disminución en valor absoluto con el valor de g. De forma heurística he aplicado una más detrending en función de los residuos de $\small r_0(g)$, de modo que llegué a $\small r_1(g) = r_0(g) \cdot 1.07^g $ que parecen ahora mucho mejor de la tendencia.

Esta es la trama de los residuos de $\small r_1(g)$:
image_resid

Ahora vemos que el periódico de las ocurrencias de los picos en pasos de 6 e incluso la aparente superposición. Por lo tanto me marcó el pequeño primefactors $\small (3,5,7,11)$ g y vemos una fuerte indicación de un aditivo composición, debido a que primefactors en $g$
image_resid_primefactors
Los puntos rojos marcan que g divisible por 3, puntos verdes que por 5, y vemos, que en g que son divisibles por tanto la frecuencia es aún mayor.

También he intentado una regresión múltiple usando ese pequeño primefactors en que los residuos, pero esto está todavía en proceso de....

22voto

Reikku Kulon Puntos 131

Parece razonable esperar que los números primos para "saber" que los números primos son adyacentes. El consecutivo el primer sesgo debe ser un síntoma de un fenómeno más general. Algunos experimentos muestran que cada uno de los prime parece repeler a los demás en su clase residual, sobre una distancia considerable.

Revisión de un primer $p$ y seleccione los números primos $q \gg p$. Deje $r$ ser razonablemente grande de la radio, como $p \log q$, y deje $n$ intervalo en el intervalo de $(q - r, q + r)$. Ignorando $q$, $n$ parece ser el primer menor frecuencia por $n \equiv q \pmod p$$n \not\equiv q \pmod p$.

Por ejemplo, con $p = 7$ $q$ desde $7^7$$7^8$, estos son los números primos se cuentan en cada uno de los residuos de la clase (con muchos solapamientos):

$$ \pequeño \begin{array} {r|rrrrrr} [q] & n \equiv +1 & +2 & \mathit{+3} & -3 & \mathit{-2} & \mathit{-1}\\ \hline +1 & 108980 & 128952 & 126384 & 127903 & 128088 & 126665\\ +2 & 128952 & 108641 & 128836 & 126463 & 127911 & 127999\\ \mathit{+3} & 126386 & 128838 & 108915 & 128655 & 126043 & 128555\\ -3 & 127904 & 126464 & 128655 & 108843 & 129049 & 126684\\ \mathit{-2} & 128087 & 127910 & 126040 & 129046 & 109062 & 129065\\ \mathit{-1} & 126665 & 128001 & 128553 & 126686 & 129068 & 109293\\ \end{array}$$

Cursiva indican el cuadrática nonresidues, que no cuenta para los más pequeños de sesgos.

La repulsión persiste incluso para los intervalos de $(q + p \log q, q + \sqrt{q})$, lo que da 10-30 primos por residuo de la clase en torno a cada una de las $q$:

$$ \pequeño \begin{array} {r|rrrrrr} [q] & n \equiv +1 & +2 & \mathit{+3} & -3 & \mathit{-2} & \mathit{-1}\\ \hline +1 & 1009455 & 1015043 & 1015079 & 1014692 & 1012735 & 1014648\\ +2 & 1010366 & 1006394 & 1015175 & 1012825 & 1014562 & 1011749\\ \mathit{+3} & 1014932 & 1010510 & 1008805 & 1014377 & 1015580 & 1017266\\ -3 & 1012473 & 1013167 & 1011447 & 1007058 & 1015711 & 1014626\\ \mathit{-2} & 1017126 & 1011133 & 1014870 & 1010336 & 1008950 & 1016188\\ \mathit{-1} & 1015821 & 1014746 & 1012491 & 1014960 & 1012051 & 1010063\\ \end{array}$$

Ya no hay nada especial acerca de la $p = 7$, la repulsión probable es que se produce para todos los $p$. Esto significa que, por el simple determinar el $q$ primo, aprendemos algo sobre muchos compuestos de números arbitrarios de residuos de clases, sin la localización de cualquiera de ellos precisamente.


El siguiente es un gráfico de $\frac{\phi(n)}{n}$ por extraño $n$ $p = 11, r = 2 \cdot 11^2$ (horizontal), en el residuo de clases modulo $11^2$ (vertical), promediado sobre todos los intervalos acerca de $q \in (11^5, 11^6)$ y normalizado, con $n \equiv q \pmod{11}$ en verde, escalado a 2x2 azulejos. Oscuro azulejos rara vez se corresponden con los números primos.

$\frac{\phi(n)}{n}$

Primeras diferencias:

first differences of $\frac{\phi(n)}{n}$

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X