31 votos

Ideas en la demostración elemental del teorema de los números primos (Selberg / Erdos)

Estoy leyendo la prueba elemental del teorema de los números primos (Selberg / Erdos, alrededor de 1949).

Un paso clave es demostrar que, con $\vartheta(x) = \sum_{p\leq x} \log p$ ,

$$(1) \qquad\qquad \vartheta(x) \log x+\sum_{p\leq x}(\log p) \vartheta(x/p) = 2x\log x+O(x)$$

  1. ¿Cuál es la idea de esta identidad?

    Este es el argumento heurístico que entiendo: si $p$ es un número primo, el intervalo medio antes del siguiente primo es $\approx \log p$ . Así, si fijamos un peso $0$ para los números no primos, y $\log p$ para los números primos, entonces cuando sumamos todos estos pesos para $n = 1 ... x$ deberíamos obtener $\vartheta(x) = \sum_{p \leq x} \log p \sim x$ y eso equivale a la PNT. Bien.

    Pero de dónde viene la idea de añadir en el lado izquierdo de la identidad (1) la parte $\sum_{p\leq x}(\log p) \vartheta(x/p)$ ? ¿Cuál es la idea aquí?

  2. ¿Cuál es la idea de pasar de (1) al teorema de los números primos?


_Nota: la identidad (1) puede sustituirse por una identidad equivalente con $\psi(x) = \sum_{p^k\leq x} \log p = \sum_{n \leq x} \Lambda(n)$ (donde $\Lambda(n) = \log p$ si $n=p^k$ y $0$ en caso contrario):_

$$(2) \qquad\qquad \psi(x) \log x+\sum_{n\leq x}\Lambda(n) \psi(x/n) = 2x\log x+O(x)$$

Otra forma equivalente es (por si acaso (2) o (3) fuera más fácil de entender):

$$(3) \qquad\qquad \sum_{p \leq x} (\log p)^2 + \sum_{pq\leq x} \log p \log q= 2x\log x+O(x)$$

1 votos

Esto me hace pensar en la integración por partes.

7 votos

Tal vez lea primero el artículo mensual de Levinson sobre la prueba elemental; la revisión de matemáticas de Ingham; y, por ejemplo, el tratamiento en el libro de Montgomery y Vaughan sobre la teoría de números multiplicativa.

1 votos

Gracias @Lucia, voy a leerlos. Enlace para la primera referencia: math.uci.edu/~brusso/levinson.pdf . ¿Algún enlace PDF para el artículo de Ingham? (Ya no estoy en un laboratorio de investigación, así que ya no tengo acceso completo a los artículos de investigación).

52voto

steevc Puntos 211

La prueba analítica compleja del teorema de los números primos puede ayudar a informar a la elemental.

La función de von Mangoldt $\Lambda$ está relacionada con la función zeta de Riemann $\zeta$ mediante la fórmula $$ \sum_n \frac{\Lambda(n)}{n^s} = -\frac{\zeta'(s)}{\zeta(s)},$$ al menos en la región $\mathrm{Re}(s) > 1$ . El lado derecho tiene un polo de residuo 1 en el polo simple $s=1$ de $\zeta$ y un polo de residuo -1 en cada cero $s=\rho$ de $\zeta$ . Aplicando cuidadosamente la fórmula de Perron, se llega finalmente a la fórmula de von Mangoldt fórmula explícita

$$ \sum_{n \leq x} \Lambda(n) = x - \sum_\rho \frac{x^\rho}{\rho} + \dots$$ donde los términos restantes $\dots$ (así como la forma en que se interpreta la suma infinita sobre ceros) se ignorará para esta discusión. Esta fórmula sugiere fuertemente que los ceros $\rho$ con parte real estrictamente menor que uno, finalmente sólo hará una contribución de orden inferior a $\sum_{n \leq x} \Lambda(n)$ mientras que los ceros $\rho$ con parte real igual a uno probablemente destruiría el teorema del número primo. De hecho, se puede seguir esta línea de razonamiento con más cuidado y demostrar que el teorema de los números primos es equivalente a la ausencia de ceros de zeta en la recta $\mathrm{Re}(s)=1$ .

Pero, ¿y si hubiera una forma de hacer que la contribución de los ceros de zeta fuera menor que la del polo, incluso cuando dichos ceros se encuentran en la recta $\mathrm{Re}(s)=1$ ? Una forma de hacerlo es sustituir la derivada logarítmica $-\frac{\zeta'(s)}{\zeta(s)}$ por la variante $\frac{\zeta''(s)}{\zeta(s)}$ . Suponiendo por simplicidad que todos los ceros son simples, esta función sigue teniendo un polo simple en cada cero $\rho$ (con residuos $\frac{\zeta''(\rho)}{\zeta'(\rho)}$ ), pero ahora tiene un doble poste en $s=1$ (con residuos $2$ ). Resulta que esta variante también tiene una representación en serie de Dirichlet $$ \sum_n \frac{ \Lambda_2(n) }{n^s} = \frac{\zeta''(s)}{\zeta(s)}$$ que por la fórmula de Perron sugiere una asintótica de la forma $$ \sum_{n \leq x} \Lambda_2(n) = 2 x \log x + \sum_\rho \frac{\zeta''(\rho)}{\zeta'(\rho)} \frac{x^\rho}{\rho} + \dots$$ Ahora, aunque haya ceros en $\mathrm{Re}(s)=1$ su contribución debería seguir siendo menor que el término principal, y uno puede ahora ser llevado a predecir una asintótica de la forma $$ \sum_{n \leq x} \Lambda_2(n) = 2 x \log x + O(x) \quad (4)$$ y además esta asintótica debería ser más fácil de demostrar que el teorema de los números primos, ya que no depende de evitar los ceros en el borde de la franja crítica.

Las funciones $\Lambda_2$ y $\Lambda$ están relacionados a través de la identidad $$ \frac{\zeta''(s)}{\zeta(s)} = -\frac{d}{ds} (-\frac{\zeta'(s)}{\zeta(s)}) + (-\frac{\zeta'(s)}{\zeta(s)})^2$$ que después de invertir la serie de Dirichlet conduce a $$ \Lambda_2(n) = \Lambda(n) \log n + \sum_{d|n} \Lambda(d) \Lambda(\frac{n}{d}) \quad (5)$$ y a partir de esto y de (4) obtenemos pronto (2) y, por tanto, (1).

También se puede pensar en esto desde el punto de vista de la "música de los primos". La fórmula explícita es moralmente resolutiva $\Lambda$ en "armónicos" como $$ \Lambda(n) \approx 1 - \sum_\rho n^{\rho-1} + \dots \quad (6)$$ donde estoy siendo deliberadamente vago en cuanto a cómo interpretar los símbolos $\approx$ , $\sum$ y $\dots$ . La convolución de Dirichlet de $1$ con sí mismo se asemeja a $\log n$ mientras que la convolución Dirichlet de $-n^{\rho-1}$ con sí mismo se asemeja a $n^{\rho-1} \log n$ ; también, términos cruzados como la convolución de $1$ con $-n^{\rho-1}$ experimentan una importante cancelación y deben ser de orden inferior. Así, el lado derecho de (5) amplifica el armónico "1" de $\Lambda$ por un factor de aproximadamente $2 \log n$ mientras se amortiguan las contribuciones de cada uno de los ceros $\rho$ debido a la cancelación entre los dos términos, lo que nos lleva a (1) o (2) como una versión suavizada del teorema de los números primos. A la inversa, (2) combinada con (5) puede verse como una forma elemental de codificar (los términos mayores de) la fórmula explícita (4), sin mención explícita de los ceros.

La parte más difícil de la prueba elemental de Erdos-Selberg de la PNT es el paso de (1) al teorema de los números primos, ya que aquí debemos eliminar realmente el escenario en el que hay un cero en $\mathrm{Re}(s)=1$ . La clave para ello es aprovechar la no negatividad de $\Lambda$ ; moralmente, la expansión (6) impide $\rho$ (y por lo tanto también $\overline{\rho}$ ) de estar acostado en $\mathrm{Re}(s)=1$ ya que esto haría que la RHS del lado derecho fuera negativa "en promedio" para ciertos conjuntos de $n$ . Hay varias formas de precisar esta intuición; las pruebas analíticas complejas estándar a menudo proceden a probar $\Lambda$ contra $n^{\pm it}$ y $n^{\pm 2it}$ , donde $1+it$ es un hipotético cero de $\zeta$ . A grandes rasgos, la idea de la prueba elemental es explotar no sólo la no negatividad de $\Lambda$ pero también los límites superiores procedentes de los límites teóricos del tamiz, como el Desigualdad Brun-Titchmarsh que, a grandes rasgos, nos dicen que $\Lambda$ se comporta "en promedio" como si estuviera entre $0$ y $2$ . (En realidad, la fórmula de Selberg (2) ya da un sustituto adecuado de esta desigualdad para los fines de este argumento). Por otra parte, a partir de (6) vemos que si hubiera un cero $\rho = 1+it$ en la línea $\mathrm{Re}(s)=1$ entonces $\Lambda-1$ debería tener una correlación muy grande con $\mathrm{Re} n^{\rho-1} = \cos(t \log n)$ y estos dos hechos pueden ponerse en contradicción entre sí, básicamente porque el valor medio de $|\cos(t \log n)|$ es estrictamente menor que uno. Sin embargo, como los ceros $\rho$ no están explícitamente presentes en la fórmula de Selberg (2), hay que trabajar bastante en la demostración elemental para que este argumento sea riguroso. En esta entrada de mi blog Utilizo un poco de teoría del álgebra de Banach para descifrar los ceros $\rho=1+it$ de la fórmula de Selberg (pueden interpretarse como el "espectro de Gelfand" de una determinada norma de álgebra de Banach asociada a dicha fórmula) para hacer más explícita esta conexión.

1 votos

Muchas gracias por tu respuesta @TerryTao, esto es esclarecedor. Estoy seguro de que la gente ha estudiado a fondo si las generalizaciones de tales identidades de Selberg podrían mejorar (aunque sea un poco) el teorema del número primo (término de error). ¿Supongo que no existe tal cosa (todavía)?

5 votos

Hay algunos trabajos (de Diamond-Steinig y otros) sobre esto, pero los mejores límites que se pueden obtener por medios elementales se quedan cortos respecto a lo que da el método complejo clásico, por no hablar de los límites más avanzados de Vinogradov y Korobov - véase este estudio de Diamond en projecteuclid.org/download/pdf_1/euclid.bams/1183549769 En particular, la sección 8. Por otra parte, creo que el moderno enfoque "pretencioso" de la teoría analítica de números puede recuperar la mayoría de los límites analíticos-complejos sin utilizar directamente los métodos complejos: véase arxiv.org/pdf/1203.0596v3.pdf

20voto

Matt Puntos 8

Como complemento a la agradable respuesta de Terry, permítanme intentar explicar desde un punto de vista más elemental por qué la fórmula de Selberg (1) es natural, y por qué es verdadera.

Es natural formular la PNT en términos de la función de von Mangoldt $\Lambda(n)$ porque se apoya en las potencias primarias, donde viene dada por la sencilla fórmula analítica $\Lambda(p^r)=\log p$ . Además, $\Lambda(n)$ está íntimamente relacionada con la función de Möbius $\mu(n)$ y la función zeta de Riemann mediante las fórmulas equivalentes $$ \Lambda=\mu\ast\log,\qquad 1\ast\Lambda=\log,\qquad \sum_{n=1}^\infty\frac{\Lambda(n)}{n^s}=-\frac{\zeta'}{\zeta}(s).$$ La idea de Selberg era que una cantidad natural y un poco más accesible surge si convulsionamos $\mu$ no con $\log$ pero un poder de $\log$ : $$ \Lambda_k=\mu\ast\log^k,\qquad 1\ast\Lambda_k=\log^k,\qquad \sum_{n=1}^\infty\frac{\Lambda_k(n)}{n^s}=(-1)^k\frac{\zeta^{(k)}}{\zeta}(s).$$ Es un bonito ejercicio que $\Lambda_k(n)$ es no negativo, por lo que a lo sumo $\log^k(n)$ y se admite en números con un máximo de $k$ factores primos distintos. Ahora (1) es esencialmente lo mismo que $$ \sum_{n\leq x}\Lambda_2(n)=2x\log x+O(x), $$ es decir, un análogo de la PNT para números con a lo sumo dos factores primos distintos (lo que hace que la suma sea más suave). Esto explica por qué (1) es tan natural y útil de ver. Otra cosa, y el ingenio de Selberg y Erdos, es que se pueda derivar información de la distribución de números con a lo sumo dos factores primos distintos para la distribución de potencias primarias.

En general, tenemos la siguiente generalización de la fórmula de Selberg (1): $$ \psi_k(x):=\sum_{n\leq x}\Lambda_k(n)=x P_k(\log x)+O(x),\qquad k\geq 2,$$ donde $P_k(t)\in\mathbb{R}[t]$ es un polinomio de grado $k-1$ con coeficiente principal $k$ . Permítanme esbozar una prueba de esta fórmula más general. Primero, usando las definiciones, $$ \psi_k(x)=\sum_{n\leq x}\mu(n)L_k(x/n),$$ donde $L_k$ es la función sumatoria de $\log^k$ : $$ L_k(x):=\sum_{n\leq x}\log^k(n).$$ Un punto clave es que $L_k(x)$ es una suma suave, de hecho por simple cálculo $$ L_k(x)=xR_k(\log x)+O(\log^k(x)), $$ donde $R_k(t)\in\mathbb{R}[t]$ es un polinomio de grado $k$ con coeficiente principal $1$ . Ahora se trata de comparar $L_k$ con las funciones sumatorias de las funciones divisoras generalizadas: $$ T_j(x):=\sum_{n\leq x}\tau_j(n),\qquad \tau_j:=1\ast\dots\ast 1. $$ Estos son más fáciles de analizar que $\psi_k(x)$ De hecho, se puede demostrar de forma elemental que $$ T_j(x)=xS_j(\log x)+O(x^{1-1/j}), \qquad j\geq 1,$$ donde $S_j(t)\in\mathbb{R}[t]$ es un polinomio de grado $j-1$ con coeficiente principal $1/(j-1)!$ . Aquí utilizamos la convención de que $\tau_1:=1$ para que $T_1(x)=\lfloor x\rfloor=x+O(1)$ como se ha afirmado. De ello se desprende que $L_k(x)$ se puede aproximar bien con una combinación lineal de las $T_j(x)$ 's: $$ L_k(x)=k!T_{k+1}(x)+a_kT_k(x)+\dots+a_1T_1(x)+O(x^{1-1/k}).$$ Introduciendo esto en nuestra fórmula para $\psi_k$ obtenemos $$ \psi_k(x)=\sum_{n\leq x}\mu(n)\Bigl\{k!T_{k+1}(x/n)+a_kT_k(x/n)+\dots+a_1T_1(x/n)\Bigr\}+O(x).$$ Sin embargo, para cada $j\geq 2$ , $$ \sum_{n\leq x}\mu(n)T_j(x/n)=\sum_{n\leq x}(\mu\ast\tau_j)(n)=\sum_{n\leq x}\tau_{j-1}(n)=T_{j-1}(x), $$ y también $$ \sum_{n\leq x}\mu(n)T_1(x/n)=\sum_{n\leq x}(\mu\ast 1)(n)=1, $$ por lo tanto, de hecho $$\begin{align*} \psi_k(x)&=k!T_k(x)+a_kT_{k-1}(x)+\dots +a_2 T_1(x)+a_1+O(x)\\ &=x\Bigl\{k!S_k(\log x)+a_kS_{k-1}(\log x)+\dots + a_2 S_1(\log x)\Bigr\} + O(x).\end{align*} $$ Esto demuestra que la aproximación reclamada para $\psi_k(x)$ con el polinomio $$P_k(t):=k!S_k(t)+a_kS_{k-1}(t)+\dots+a_2 S_1(t).$$ Este polinomio tiene coeficientes reales, grado $k-1$ y el coeficiente principal $k!/(k-1)!=k$ , donde utilizamos que $k\geq 2$ en todo. La prueba es completa.

0 votos

Muchas gracias. ¿Qué quieres decir con "... una cantidad ligeramente más accesible"? ¿Te refieres a que podemos obtener la identidad por $\sum_{n\leq x} \Lambda_2(n)$ mientras que no es posible demostrar una identidad directa para $\sum_{n\leq x} \Lambda(n)$ (esto último sería una prueba directa de TNP)? Segunda preguntita: ¿hay una aplicación de las identidades para $\sum_{n\leq x} \Lambda_k(n)$ con $k \geq 3$ ? ¿Podemos obtener algo mejor que la forma original / término de error de la prueba elemental de TNP con esta identidad cuando $k \geq 3$ ? Sería interesante ver las aplicaciones de la identidad de Selberg generalizada.

0 votos

@Basj: Me refería a que es más fácil sumar $\Lambda_k(n)$ cuando $k\geq 2$ que para $k=1$ Porque el término principal tiene una estructura más fina (término principal, término principal secundario, etc.), y esto es lo que he intentado dejar claro en mi post. Además, aunque no soy un experto en esto, creo que la fórmula de $\psi_k(x)$ no es más útil para $k\geq 3$ que para $k=2$ . De hecho, todas estas fórmulas se desprenden sin mucho esfuerzo de la PNT, mientras que la propia PNT se desprende de la $k=2$ caso. Así que, en cierto sentido, más grande $k$ corresponde a una declaración más débil, aunque esto es subjetivo al final.

5voto

mspmsp Puntos 843

Ya se han dado dos respuestas muy bonitas, pero me gustaría añadir que Michel Balazard tiene un libro en preparación sobre este tema (escrito para estudiantes de grado), en el que intenta dar una deducción de la PNT a partir de la identidad de Selberg lo más sencilla posible. Además, un estudiante de aquí tiene un bonito redacción de la prueba. Es muy corto, es elemental, pero está en francés.

2 votos

El enlace está roto, ¿podríais actualizarlo? ¿También hay novedades sobre el libro?

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X