24 votos

El lagrangiano en la teoría de campos escalares

Quizás sea una pregunta ingenua, pero ¿por qué escribimos el Lagrangiano

$$\mathcal{L}=\frac{1}{2}\eta^{\mu\nu}\partial_{\mu}\phi\partial_{\nu}\phi - \frac{1}{2}m^2\phi^2$$

como el Lagrangiano más simple para un campo escalar real? Esto no me parece en absoluto obvio. Al fin y al cabo, da lugar a un término de energía cinética (muy bien), a cierta energía potencial específica no motivada (menos bien) y a una energía de gradiente (aún menos obvia).

¿Existe algún principio por el que sepamos estudiar este Lagrangiano? ¿Es sólo que $\mathcal{L}$ da lugar a una bonita ecuación (la ecuación de Klein-Gordon), que podemos interpretar de forma atractiva? Esta razón parece en cierto modo vacía.

He oído a gente mencionar la causalidad como motivación, pero no veo cómo se relaciona. ¿Podría alguien darme alguna intuición?

Muchas gracias de antemano.

12voto

adb12 Puntos 111

Tengo una perspectiva ligeramente distinta a la de las otras dos respuestas, que aporta una motivación más elemental. Supongamos que no sabes nada de renormalizabilidad ni de relaciones energía-momento y lo único que sabes es que una densidad lagrangiana es una función de campos y sus derivadas que se transforma como un escalar bajo transformaciones de Poincaré.

Se puede motivar la ecuación de Klein-Gordon preguntando cuál es el Lagrangiano más simple que se puede escribir para un campo escalar que se transforma como escalar y proporciona un Hamiltoniano positivo-definido.

Dado que estamos tratando con campos escalares cualquier función polinómica de los campos $\phi$ satisfará la propiedad correcta de transformación de Lorentz. Así que se podría escribir un término como $a\phi+b\phi^2$ con constantes reales $a$ y $b$ . Ahora también queremos incluir las derivadas $\partial_\mu\phi$ . Para satisfacer las propiedades correctas de la transformación de Lorentz necesitamos contraer esto con un término $\partial^\mu\phi$ .

Así que el Lagrangiano más simple que podemos escribir es $\mathcal{L}=c\partial_\mu\phi\partial^\mu\phi+a\phi+b\phi^2$ a partir de la cual obtenemos un Hamiltoniano

$\mathcal{H}=\frac{\pi^2}{4c}+c\partial_i\phi\partial_i\phi-a\phi-b\phi^2$

En $a\phi$ no es bueno, ya que arruina la definición positiva del Hamiltoniano, por lo que hay que poner $a=0$ . Tanto un campo escalar como las derivadas tienen dimensión de $[mass]^2$ y la densidad lagrangiana tiene dimensión $[mass]^4$ Así que $c$ debe ser adimensional y $b$ debe ser $b=-m^2$ donde $m$ tiene unidades de masa y el signo menos está ahí para hacer el Hamiltoniano positivo-definido.

Así que hemos reducido nuestro Hamiltoniano a

$\mathcal{H}=\frac{\pi^2}{4c}+c\partial_i\phi\partial_i\phi+m^2\phi^2$

Configuración $c=1/2$ y reescalado $m^2\rightarrow m^2/2$ significa que los coeficientes de todos los términos son iguales.

Por tanto, la densidad lagrangiana es $\mathcal{L}=\frac{1}{2}\partial_\mu\phi\partial^\mu\phi-\frac{1}{2}m^2\phi^2$

*Podrías intentar argumentar en contra de que este sea el Lagrangiano de campo escalar más simple;

  1. Si el objetivo es la simplicidad, ¿por qué no ignorar los términos derivados y escribir una Lagrangiana para un campo escalar como $\mathcal{L}=-m^2\phi^2$ ? Porque si se ignoran los términos derivativos la ecuación de campo es $\phi=0$ ¿Y a quién le importa eso? Ignorando las derivadas se obtiene un campo no dinámico. Así que el lagrangiano de Klein-Gordon es el más simple que se puede escribir en el que realmente ocurre algo.

Por supuesto, se puede obtener un lagrangiano válido más sencillo estableciendo $m=0$ pero esto no se hace ya que los libros quieren mostrar la relación energía-momento en un entorno general cuando cuantizas el campo. Sin embargo, se puede partir del caso sin masa en 5 dimensiones y realizar una reducción dimensional para obtener el caso masivo en 4 dimensiones.

  1. ¿Por qué ignorar la posibilidad de términos de interacción campo-derivada? Se puede hacer, pero el objetivo es la simplicidad, y el término más sencillo que acopla el campo a sus derivadas, se transforma correctamente y da un Hamiltoniano definido positivo es $\phi\phi\partial_\mu\phi\partial^\mu\phi$ que es mucho más complicado que nuestros otros términos.

8voto

Robert Brignall Puntos 33

Se puede encontrar una motivación razonable para ese Lagrangiano haciendo una analogía clásica. La energía cinética en la física clásica es proporcional al cuadrado de la tasa de cambio de la posición con el tiempo así: $$ T=\frac{1}{2}(\partial_0 \phi)^2 $$ Pero para obtener una Lagrangiana invariante de Lorentz debemos añadir: $$ -\frac{1}{2}\sum_i{(\partial_i \phi)^2} $$ Añadir y utilizar la métrica Minkowsi: $$ \frac{1}{2}\eta^{\mu\nu}\partial_{\mu} \phi\partial_{\nu} \phi $$

Supongamos ahora que el valor de equilibrio del campo es $\phi=0$ . Para un oscilador armónico simple con posición de equilibrio $x=0$ la energía potencial es como $\sim x^2$ . Si queremos que el campo prefiera su estado de equilibrio, hay que codificarlo en el potencial y el más sencillo que lo hace es el armónico: $$ V=\frac{1}{2}m^2\phi^2 $$

Combinando ambos términos, tenemos: $$ \mathcal{L}=\frac{1}{2}\eta^{\mu\nu}\partial_{\mu} \phi\partial_{\nu} \phi-\frac{1}{2}m^2\phi^2 $$

Fuente: B. Zwiebach, "A First Course in String Theory", capítulo 10.2

5voto

heathrow Puntos 25

La motivación estándar, como explicó QuantumDot, es reproducir la relación energía momento de la relatividad a partir del campo escalar. Pero hay un argumento independiente para esto que proviene de la mecánica estadística.

Consideremos una función de partición mecánica estadística para un campo definido en una red muy fina. En general, el equilibrio sólo permitirá fluctuaciones locales, de modo que el campo tendrá una distribución de probabilidad en cualquier punto de la red que es localmente independiente de las fluctuaciones en cualquier otro punto distante de la red. En este caso, se puede observar la red en escalas de distancia gruesas y definir un campo medio $\phi$ sobre muchos espaciamientos de la red,s y escribir la función de partición como un producto de funciones de partición independientes en cada punto de la red gruesa:

$$ Z = \prod \int e^{V(\phi)} d\phi$$

Y como el campo grueso de la red es la media del campo fino de la red, se sabe por el teorema del límite central que la distribución será gaussiana:

$$ Z = \int e^{\int {1\over 2}m^2 \phi^2} D\phi$$

La última línea es una integral de trayectoria, una suma tipo función de partición sobre todas las cofiguraciones, y la identidad que garantiza que reproduce fluctuaciones locales independientes es justo la misma que te dice que dos sistemas independientes tienen una función de partición que se multiplica (o una energía libre que se suma).

Este tipo de cosas es muy aburrido, y es la situación típica de los campos estadísticos o cuánticos: fluctuaciones independientes totalmente locales, lo que se suele llamar un campo ultralocal. Esto no es algo que observaríamos como algo dinámico, ya que vivimos a escalas mucho mayores que cualquier escala de granularidad.

Consideremos qué ocurriría si ajustamos las fluctuaciones para que sean grandes. Para ello es necesario ajustar con precisión el parámetro de fluctuación gaussiano efectivo $m^2$ a 0. Esto no es particularmente difícil de imaginar, porque se utiliza el teorema del límite central para obtener el $m^2$ comportamiento--- puedes imaginar que el potencial microscópico es realmente de la forma $m^2 \phi^2 + \lambda\phi^4$ y luego si afinas el $m^2$ sea un valor especial, cambiará la estabilidad del $\phi=0$ punto. Se trata de un punto crítico en mecánica estadística.

Ahora bien, si nos fijamos en las largas distancias, se espera que la energía libre de las configuraciones de campo en una red de grano grueso debe ir como:

$$ \int F(\nabla\phi, \phi) $$

Donde se amplían sólo los términos derivados más importantes. Si lo escribes como una serie, suponiendo que $\phi\rightarrow -\phi$ simetría:

$$ \int |\nabla \phi |^2 + t \phi^2 + \lambda \phi^4 + g \phi^6 + h |\nabla^2\phi|^2 $$

Entonces puedes convencerte de que bajo reescalado, manteniendo fijo el coeficiente del primer término, sólo importan los 3 primeros términos en dimensión 4 o menos. Esto quiere decir que si normalizas las fluctuaciones del campo de modo que el coeficiente de correlación de la derivada principal determine la escala del campo, sólo el término cuadrático y el cuártico son renormalizables, sólo éstos contribuyen a las correlaciones a larga distancia.

La integral de trayectoria de Feynman justifica por qué este tipo de razonamiento tiene algo que ver con la mecánica cuántica. Cualquier teoría de campo bosónica con una acción invariante en el tiempo continúa analíticamente a un campo estadístico, y este campo estadístico es un límite de longitud de onda larga de alguna cosa de distancia corta. La clasificación de las teorías posibles es entonces por la generalización del teorema del límite central que te dice que el campo ultralocal es el caso más común.

Para los fermiones quirales y los campos gauge, ni siquiera es necesario el ajuste fino de un parámetro para tener un límite fluctuante. Los campos gauge mantienen un límite fluctuante por invariancia gauge, y los fermiones quirales por el hecho de que no pueden crear una masa sin emparejarse. Estos son los ingredientes del modelo estándar.

La justificación de los lagrangianos en la teoría de campos proviene en última instancia de la renormalizabilidad, pero esto es difícil porque falta una teoría rigurosa. También se pueden justificar pidiendo una teoría en la que se tenga un número finito de partículas fundamentales de espín y masa dados, que para espín 0 reproduzca la no interacción ( $\lambda=0$ ) de este argumento. Se trata de un argumento un tanto complementario porque la unitraridad impone restricciones más fuertes a la forma del lagrangiano cuántico que el mero hecho de ser renormalizable, por lo que es bueno conocer ambas cadenas de razonamiento.

4voto

Yongke Bill Yu Puntos 150

Este es el ejemplo canónico de un relativista teoría de campos utilizada para presentar la asignatura a los estudiantes. Una de las características que hay que extraer de este modelo es la siguiente: Escribir la ecuación de movimiento de Euler-Lagrange

$$\frac{\partial\mathcal{L}}{\partial\phi}-\partial_\mu\frac{\partial\mathcal{L}}{\partial(\partial_\mu\phi)}=0$$ dando $$-m^2\phi-\partial_\mu\partial^\mu\phi=0$$ que se puede escribir: $$\big(\frac{\partial^2}{\partial t^2}-\nabla^2+m^2\big)\phi=0$$ Ahora, si te mueves al espacio de Fourier, $\phi\sim\int(dk)\,\phi_k\,e^{i\omega t-i\vec{k}.\vec{x}}+c.c.$ encontrará $$\int(dk)(-\omega^2+\vec k^2+m^2)\,\phi_ke^{i\omega t-i\vec{k}.\vec{x}}+c.c.=0,$$ o equivalentemente, cada modo satisface la siguiente relación entre la frecuencia y el número de onda: $$\omega^2=\vec k^2+m^2.$$ Al identificar la frecuencia con la energía $\omega\rightarrow E$ y el número de onda con el momento $\vec k\rightarrow \vec p$ se encuentra que cada modo satisface la relación energía momento cinemática relativista: $$E^2=\vec p^2+m^2.$$ Este es el punto de partida para la construcción de una teoría relativista de los campos cuánticos.

0voto

Shane Reustle Puntos 1878

En la obra de Leonard Susskind Relatividad especial y teoría clásica de campos ofrece una forma mucho más intuitiva, pero informal.

Imaginemos que tomamos un campo escalar, que depende del tiempo. Dejemos que este campo denote la posición de alguna partícula imaginaria. Llamémosla $\phi(t)$ . Ahora este campo describe la posición de alguna partícula imaginaria de masa $1$ .

La mecánica clásica nos dice que el Lagrangiano en este caso sería la energía cinética menos algún tipo de potencial.

$$\mathcal{L} = \frac{\dot{\phi}}{2} - V(\phi)$$

ya que hemos tomado $m = 1$ . Ahora bien, si tomamos el campo escalar y lo hacemos depender tanto del espacio como del tiempo, la opción natural es:

$$\mathcal{L} = \frac{1}{2}\dot{\phi} - \frac{1}{2}\nabla . \phi - V(\phi)$$

donde las derivadas espaciales tienen el signo menos según la convención métrica. Podemos reescribir esto como:

$$\mathcal{L} = \frac{1}{2} \partial_\mu{\phi}\partial^\mu{\phi} - V(\phi)$$

Normalmente escribimos $$V(\phi) = \frac{1}{2} \mu^2 \phi$$

Desgraciadamente, el libro no trata de por qué se elige el potencial $m^2\phi^2$ . Especifica que cualquier potencial estaría bien y que la elección es sólo una conveniencia. Sigue siendo una buena explicación.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X