31 votos

¿Por qué funciona la Teoría de la Perturbación Renormalizada?

He leído sobre la renormalización de $\phi^4$ teoría, es decir. $\mathcal{L}=\frac{1}{2}\partial_\mu\phi\partial^\mu\phi-m^2\phi^2-\frac{\lambda}{4!}\phi^4\,,$ particularmente del libro de Ryder. Pero estoy confundido sobre algo:

Ryder comienza calculando la función de Green de dos puntos $G(x,y)$ para pedir $O(\lambda^2)$ (es decir, la corrección de primer orden del propagador libre). Ahora bien, si tomamos $\lambda$ sea pequeño, entonces esto debería ser una buena aproximación, pero $G(x,y)$ diverge, por lo que lo regulariza imponiendo un corte de momento $\Lambda$ y luego hace $m$ en función de $\Lambda\,,$ es decir. $m=m(\Lambda)\,.$ Luego pasa a lo mismo para la función de Green de cuatro puntos, y encuentra que $\lambda$ es también una función del corte, es decir $\lambda=\lambda(\Lambda)\,.$ Pero en este punto $\lambda(\Lambda)$ ya no es pequeño cuando $\Lambda$ es grande (en particular $\lambda\to\infty$ como $\Lambda\to\infty$ ), ¿qué hace que la serie de perturbaciones sea válida? ¿Cómo podemos ignorar la $O(\lambda^2)$ ¿términos? He leído cosas como "renormalizado hasta 1 bucle", pero ¿qué pasa con los demás bucles, son pequeños? ¿O estoy entendiendo mal lo que ocurre?

Tal vez sea así: Cuando calculamos la función de Green de dos puntos G(x,y) después de hacer un corte de momento en algún gran $\Lambda>\Lambda_0\,,$ donde $\Lambda_0$ es mayor que el momento al que realizamos el experimento, encontramos que la masa se ha desplazado a la masa física $m_P=m+\lambda m^{(1)}(\Lambda_0)+O(\lambda^2)\,,$ donde $m^{(1)}(\Lambda)$ es un término de corrección de primer orden. Ahora tenemos una segunda ecuación para $\lambda$ dada por alguna función $\lambda(\Lambda)$ que va al infinito como $\Lambda\to\infty\,,$ pero $\lambda(\Lambda_0)<1\,.$ Entonces podemos ignorar el $O(\lambda^2)$ término y decir simplemente $m_P=m+\lambda m^{(1)}(\Lambda_0)\,.$ Ahora bien, como la física de baja energía debería ser independiente de la escala de energía y $\Lambda_0$ ya es grande, suponemos que $m_P$ tiene la misma forma en todas las escalas de energía $\Lambda$ y esto define $m$ a funciones de $\Lambda\,,$ así que $m_P=m(\Lambda)+\lambda(\Lambda)m^{(1)}(\Lambda)\,,$ y luego por cada cálculo que hagamos pedir uno en $\lambda$ sustituimos esta fórmula por $m_P$ tomar $\Lambda\to\infty$ y calcular los resultados. Ahora técnicamente una mejor aproximación a $m_P$ en el punto de corte es $m_P=m+\lambda m^{(1)}(\Lambda_0)+\lambda^2 m^{(2)}(\Lambda_0)\,,$ y por lo tanto si queremos un mejor resultado debemos poner $m_P=m(\Lambda)+\lambda(\Lambda) m^{(1)}(\Lambda)+\lambda^2(\Lambda) m^{(2)}(\Lambda)$ y hacer lo mismo. ¿Es algo así?

13voto

Giacomo Verticale Puntos 1035

La renormalización es siempre necesaria cuando el Hamiltoniano es singular. Singular significa que la expresión formal del hamiltoniano resultante de la interacción especificada no es un operador autoadjunto en un dominio denso. Entonces la dinámica está formalmente mal definida y debe ser renormalizada teniendo cuidado de representar todo adecuadamente como un límite que tenga sentido.

En particular, este es siempre el caso en las teorías cuánticas de campo relativistas que interactúan en 3 o 4 dimensiones espacio-temporales.

Para entender por qué y cómo funciona la renormalización se pueden considerar primero situaciones más simples en la mecánica cuántica. En este caso hay modelos de juguete explícitamente solubles (perturbaciones singulares de bajo rango de sistemas simples solubles) donde se puede ver exactamente lo que ocurre y por qué. Véase mi artículo Renormalización sin infinitos - un tutorial en el que se habla de ello en detalle.

Sobre cómo (o si) se puede saber si los términos de una serie asintótica serán pequeños, véanse las discusiones del capítulo B5: Divergencias y renormalización de mi FAQ de física teórica .

5voto

Mr. Tony Jessup Puntos 11

Muchas dificultades en la renormalización se aclaran, cuando se utiliza el punto de vista de la "Reparametrización de la teoría".

Permítanme ilustrar lo que quiero decir:

Si se obtiene ingenuamente una teoría de campo cuántica a partir de una teoría de campo clásica mediante un procedimiento de cuantificación, se obtienen resultados irreales para las cantidades medibles. Esto no debería sorprender: ¿Por qué los parámetros clásicos de nuestra teoría deberían ser los correctos para nuestra teoría de campos cuánticos?

Así que queremos reparametrizar nuestra teoría, de manera que los nuevos parámetros finitos den resultados realistas.

Consideremos una Densidad Lagrangiana $\mathcal{L} = \frac{1}{2} A \partial_\mu \phi \partial^\mu \phi + \frac{1}{2} B^2 \phi^2 + \frac{1}{4!} C \phi^4$ .

Ahora las cantidades medibles de la correspondiente teoría cuántica de campos dependerán de esos parámetros, por ejemplo

  • "masa física" = polo del propagador = P(A,B,C)

  • "Renormalización de la función de onda" = Residuo del propagador = Z(A,B,C)

  • "Vértice de 4 puntos en ciertos mandelstams" = G(A,B,C)

Ahora queremos invertir esas funciones para obtener una nueva parametrización A(P,Z,G), B(P,Z,G), C(P,Z,G). Como P, Z, G son medibles en el experimento, deberían ser finitas y una buena parametrización de nuestra Teoría Cuántica de Campos.

Consideremos ahora, en primer lugar, un contexto no perturbador: Aquí deberíamos ser capaces de invertir P, Z, G exactamente para obtener una reparametrización en la que nuestras cantidades medibles sean, con suerte, finitas.

En un contexto perturbativo podemos calcular P,Z,G hasta el orden, digamos, N. Entonces las "condiciones de renormalización" (que son más bien "condiciones de reparametrización") definen una reparametrización diferente para cada orden N. Si renormalizamos hasta el orden N, entonces hemos elegido una reparametrización que hace que todo sea finito hasta el orden N. Quizás esta reparametrización también haga que las cosas sean finitas en un orden superior, pero quizás no.

Nota Bene: Cosas como MS o MS-bar sólo definen diferentes condiciones de renormalización/reparametrización, a saber, implícitamente a través de los contratemas, ya que cada esquema de sustracción determina la estructura de los contratemas y la estructura de los contratemas determina la reparametrización.

P.D.: En la nomenclatura anterior normalmente se elige la condición de reparametrización Z(A,B,C) = 1.

P.P.D.: Este post es más una ilustración que una verdadera argumentación rigurosa. Pero todo lo que he dicho se puede hacer más riguroso.

4voto

Aravind Puntos 21

Antes de intentar responder a su pregunta, una cosa:

¿Realmente Ryder calcula el $\mathcal{O}(\lambda^2)$ al propagador como la primera contribución en la teoría de la perturbación, porque en realidad hay una $\mathcal{O}(\lambda^1)$ al propagador y el $\mathcal{O}(\lambda^2)$ -es, en mi opinión, un diagrama de dos bucles, es decir, que tiene dos momentos de bucle, lo que en realidad es difícil de trabajar como un primer ejemplo para introducir el procedimiento de renormalización. Pero para ser sinceros, este $\mathcal{O}(\lambda^1)$ -contribución no conduce a ninguna renormalización de la masa, por lo que no se aprenderá tanto de esto, pero no estoy seguro si Ryder menciona esto.

Pero permítame tratar de responder a su pregunta con un punto de vista ligeramente diferente:

La cosa con la renormalización es que ves que tus integrales de bucle divergen, así que impones un corte de momento $\Lambda$ La teoría sólo tiene un rango de validez limitado. Y como ya has mencionado, el resultado será entonces dependiente de este corte, por lo que "ocultas" la dependencia del corte en la redefinición de los parámetros (masas y acoplamientos) de tu teoría. El argumento es que los parámetros que escribes en el Lagrangiano (digamos, $\lambda_0$ y $m_0$ ) no tienen ningún significado físico, pero los parámetros que se miden mediante experimentos ( $\lambda$ y $m$ ) tienen y se desplazan. Así que hasta aquí es correcto decir que los parámetros dependen del corte, pero el problema que mencionas no se plantea.

Permítanme señalar esto en el siguiente ejemplo: Para el $\phi$ -propagador (la función de Green) se obtiene alguna modificación debido a la integral del bucle $\Pi(p^2;\Lambda)$ : $$\frac{i}{p^2-m^2+i\epsilon} \quad\to\quad \frac{i}{p^2-m^2-\Pi(p^2;\Lambda)+i\epsilon} $$ donde se puede interpretar el término $m^2 + \Pi(p^2;\Lambda) $ como el efectivo $m_\mathrm{eff}^2$ del propagador. (A la forma del propagador incluyendo los bucles, es más o menos una serie geométrica de propagador libre e inserciones de lopp) Para continuar, ahora es necesario declarar, cómo se define su parámetro (en este caso la masa $m$ ) imponiendo una determinada condición de renormalización. Así, por ejemplo, una opción particular es que se diga que para $p^2 = m^2$ $m_\mathrm{eff}^2 = m^2$ o $\Pi(p^2=m^2;\Lambda) = 0$ . Pero incluso en este caso verá un $\Lambda$ -término dependiente en $\Pi(p^2;\Lambda)$ Para deshacerte de esto, redefine la integral del bucle como $$ \Pi(p^2;\Lambda) \quad\to\quad \overline{\Pi}(p^2) = \lim_{\Lambda\to\infty} \left( \Pi(p^2;\Lambda) - \Pi(p^2=m^2;\Lambda) \right) $$

El límite $\Lambda\to\infty$ se puede hacer, porque se resta más o menos la parte divergente de la integral de bucle. Y ese es el punto importante no sólo dices que redefines tus parámetros a dependientes del corte, sino que también impones una condición de renormalización que al final lleva a un $\Lambda$ -cantidad independiente.

4voto

aceinthehole Puntos 106

Me gustaría destacar la diferencia entre

1) Renormalización Perturbativa

2) Renormalización no-perturbativa

Por Renormalización Perturbativa me refiero a eliminar los infinitos del cálculo de un correlador/amplitud, orden por orden . Esto se hace introduciendo contraterms, es decir, reescribiendo los parámetros desnudos del lagrangiano como $\lambda_{Bare} = \lambda_{obs} + \delta \lambda$ eligiendo un esquema de regularización con su escala de "corte" $\Lambda$ e imponiendo el valor de un (posible número finito de) correladores/amplitudes. Hay que medir realmente estos valores para establecerlos, no se pueden calcular a partir de la teoría. En términos de estos parámetros, cualquier otro correlacionador/amplitud puede ser calculado obteniendo un resultado finito, sin importar lo alto que sea el orden al que se llegue.

La razón de que esto funcione puede interpretarse con un análisis diagramático complicado o con un enfoque de corte flotante, a la manera de Wilson.

Ahora pasemos al segundo punto.

Una vez resuelto el primer problema (haciendo finitas las cantidades orden por orden), y empiezas a calcular los correladores/amplitudes, descubres que los resultados (ahora finitos) implican "grandes logaritmos" como $log(m/m_0)$ donde $m_0$ es la escala de renormalización, es decir, la escala típica de las cantidades que se miden e imponen que podrían ser, por ejemplo, correlacionadores/amplitudes que implican campos/partículas con una escala de energía común similar, y $m$ es la escala típica del correlador/amplitud que se quiere calcular. Esto es un problema porque, aunque las cantidades que estás calculando son finitas en cada orden, no puedes despreciar los órdenes superiores que implican más y más de estos "grandes logaritmos".

La solución a este problema es suavizar el paso de la escala de renormalización a la escala de interés, es decir, pasar de $m_0$ a una escala $m'_0 = m_0 + \delta m$ (ahora los logaritmos son pequeños), y de aquí a $m'_0 + \delta_m$ y así sucesivamente hasta llegar a $m$ . Este procedimiento de "suavización" es el Flujo del Grupo de Renormalización, y puede pensarse como una expansión de los correladores/amplitudes no en términos de $\lambda_{Bare}$ o $\lambda_{obs}$ sino de costes de acoplamiento que dependen (o corren) de la escala $m$ de los observables que quieres calcular.

Ahora bien, si este funcionamiento es tal que los costes de acoplamiento siguen siendo pequeños, entonces la expansión perturbativa seguirá siendo válida y, por tanto, la "renormalización perturbativa" es válida; de lo contrario, habrá que idear otra técnica para producir previsiones cuantitativas a partir de su teoría.

3voto

Eric Drechsel Puntos 111

El truco está en la introducción de una escala de renormalización.

Una vez regularizada la teoría de perturbaciones, se obtiene una interacción dependiente del momento (y del corte) de la forma (esquemática) en 4D $$\lambda(p)=\lambda_0+\alpha\lambda_0^2 \ln(\Lambda^2/p^2), $$ donde $\lambda_0$ es la interacción desnuda, y $\alpha$ algunos factores numéricos.

Lo que se hace es fijar el valor de la interacción a una energía determinada $p^2=\mu^2$ , de tal manera que $\lambda(\mu)\ll 1$ . Expresando $\lambda(p)$ en términos de $\lambda (\mu)$ se obtiene $$\lambda(p)=\lambda(\mu)+\alpha \lambda(\mu)^2\ln(\mu^2/p^2),$$ que es, de hecho, una buena teoría de la perturbación.

Nótese que esta teoría de la perturbación funciona bien sólo para energías lo suficientemente cercanas a $\mu$ y que el punto de referencia $\lambda(\mu)$ debe ser dada por los experimentos, o una teoría más fundamental.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X