28 votos

Física de partículas y representaciones de grupos

Esta pregunta se hace desde un punto de total desconocimiento de la física y del modelo estándar.

De vez en cuando oigo que las partículas corresponden a representaciones de ciertos grupos de Lie. Para una persona que desconoce por completo la física, esto parece muy impar. ¿Cómo ha surgido esto? ¿Hay alguna "razón" para pensar que esto sea así? ¿O es que las observaciones de la física de partículas se han correspondido milagrosamente con la teoría de la representación? ¿O la teoría de la representación de los grupos de Lie ha surgido de las observaciones de la física de partículas?

En resumen: ¿cuál es la cronología del desarrollo de la teoría de la representación y de la física de partículas (con relación entre sí), y cómo se puede dar sentido a esta relación de otra manera que no sea una extraña coincidencia?

16voto

PabloG Puntos 9308

Permítanme añadir algo a lo que ya se ha escrito anteriormente.

El marco actual de la mecánica cuántica motiva el estudio de las representaciones proyectivas (anti)unitarias de los grupos de simetría del sistema físico. En el contexto de la teoría de campo cuántica relativista de cuatro dimensiones (con algunas suposiciones leves), se deduce de un célebre teorema de Coleman y Mandula que el grupo de simetría es un producto directo de (la cubierta universal de) el grupo de Poincaré y un grupo de Lie compacto. (Se puede eludir este teorema considerando no grupos de Lie sino supergrupos de Lie, pero esa es otra historia). Me centraré en el grupo de Poincaré. La determinación de las representaciones irreducibles unitarias (físicamente relevantes) del grupo de Poincaré se debe a Wigner, generalizando (aunque quizás no conscientemente) el método de representaciones inducidas de Frobenius. Fue Mackey quien amplió el método de Wigner y lo situó firmemente en el contexto matemático "correcto".

Lo que quiero decir es que al abordar la teoría de la representación del grupo de Poincaré (sea cual sea la motivación de este estudio) de esta manera se establece un contacto natural con la física de partículas.

Representaciones inducidas

Empecemos por los grupos finitos. Sea $G$ sea un grupo finito y $H$ sea un subgrupo y que $\delta: H \to \mathrm{U}(W)$ sea una representación unitaria en un espacio vectorial hermitiano de dimensión finita $W$ . Consideremos el espacio vectorial $V$ de las funciones $f:G \to W$ con la condición de equidistancia $f(gh) = \delta(h^{-1}) f(g)$ para todos $g \in G$ y $h \in H$ . El homomorfismo $\rho:G \to \mathrm{GL}(V)$ definido por $$(\rho(g) f)(g') = f(g^{-1}g')$$ hace $V$ en una representación de $G$ . (Hay que comprobar que $\rho(g) f \in V$ de nuevo).

Además, es posible definir en $V$ una estructura hermitiana respecto a la cual $\rho$ es una representación unitaria. Esto se ve mejor si se ve $V$ en una luz diferente. Deje que $X= G/H$ sea el espacio de la izquierda $H$ -cosetas en $G$ . Entonces $V$ es isomorfo al espacio vectorial de funciones $\psi: X \to W$ pero no canónicamente. El isomorfismo depende de la elección del representante del coset $\sigma: X \to G$ una sección a través de la suryección $\pi: G \to X$ . Entonces, dado $f \in V$ definimos $\psi(x)= f(\sigma(x))$ . A la inversa, dado $\psi:X \to G$ definimos $f \in V$ escribiendo $g = \sigma(\pi(g))h(g)$ para algunos $h(g) \in H$ y declarando $f(g) = \delta(h(g)^{-1}) \psi(\pi(g))$ . Entonces definimos el producto interior de $f_i \in V$ para ser $$ \langle f_1,f_2\rangle_V = \sum_{x\in X} \langle f_1(\sigma(x)), f_2(\sigma(x)) \rangle_W.$$ Se puede demostrar que esto es independiente del representante del coset precisamente porque $W$ es una representación unitaria de $H$ .

La representación $V$ de $G$ se dice que se induce a partir de la representación $W$ de $H$ .

Método de Wigner

El método de Wigner es formalmente muy similar: $G$ es el grupo de Poincaré; es decir, el producto semidirecto $L \ltimes T$ , donde $L = \mathrm{Spin}(3,1)$ es la cubierta de espín del grupo de Lorentz y $T$ es el ideal de traducción. Wigner comienza eligiendo un personaje $p$ de $T$ que físicamente se interpreta como un impulso . Una versión del Lemma de Schur dice que en una representación irreducible de la $G$ Todos los caracteres de $T$ que aparecen comparten la misma norma minkowskiana $p^2$ . Las representaciones físicamente relevantes tienen $p^2 = - m^2$ , donde $m\geq 0$ es el masa .

Dejemos que $H < G$ denotan el estabilizador de $p$ . Wigner induce una representación unitaria del grupo de Poincaré a partir de un de dimensiones finitas representación unitaria de $H$ . Ahora $H$ no es compacto, por lo que tales representaciones no son necesariamente fieles. Se factorizan a través de representaciones fieles de un grupo conocido como de Wigner pequeño grupo . Es isomorfo a $\mathrm{Spin}(3)$ para $m>0$ y $\mathrm{Spin}(2)$ para $m=0$ . Las representaciones irreducibles de dimensión finita de los pequeños grupos se etiquetan con números enteros: el girar (un número entero no negativo) para $m>0$ el helicidad para $m=0$ . Así, Wigner nos dice que a una representación unitaria irreducible del grupo de Poincaré se le puede asociar una masa y un espín/helicidad, que son los datos básicos que especifican las partículas relativistas. Pero hay más.

El espacio $G/H$ es el hiperboloide $p^2 = - m^2$ (para una masa fija $m\geq 0$ ) en el dual del álgebra de Lie de $T$ . El espacio vectorial que lleva la representación inducida de $G$ consiste en secciones (cuadradas-integrables) de haces vectoriales homogéneos sobre $G/H$ asociado a la representación de $H$ del que inducimos. Así, esto da naturalmente una representación sobre objetos geométricos definidos en el espacio $G/H$ de los momentos. Transformando de Fourier al espaciotiempo de Minkowski llegamos a secciones de haces homogéneos sobre el espaciotiempo de Minkowski que satisfacen ecuaciones diferenciales parciales (lineales) procedentes de transformar de Fourier la condición $p^2 = -m^2$ y las demás condiciones de irreductibilidad. Y la agradable sorpresa es que estas ecuaciones diferenciales parciales son precisamente las ecuaciones de campo libre linealizadas para las partículas correspondientes: ¡las ecuaciones de Klein-Gordon, Dirac, Weyl, Maxwell,...!

11voto

DCookie Puntos 1908

La "cronología" no está clara para mí, y habiendo mirado la literatura parece mucho más enrevesada de lo que debería ser. Aunque parece que esto es básicamente como se han hecho las cosas desde el principio de la mecánica cuántica (al menos, por los grandes) de una forma u otra, y se formalizó "en parte" en los años 30-40 con los inicios de la QED, pero no del todo cuidadosamente formalizado hasta los años 60-70 con el desarrollo del modelo estándar, y no matemáticamente formalizado hasta el desarrollo más cuidadoso de las cosas en términos de paquetes en los años 70-80. (Estas fechas son conjeturas - ¡alguien que haya sido un físico en ejercicio durante esos períodos es más que bienvenido a corregir mi línea de tiempo!)

En general, desde el punto de vista de la "física", la razón por la que las partículas se etiquetan según las representaciones no es muy diferente de cómo, en la mecánica cuántica normal, los estados se etiquetan por los valores propios (el artículo de la wiki enlazado lo menciona, pero no es tan claro como podría serlo).

En la QM normal, podemos tener un espacio de Hilbert ("espacio de estados") $\mathcal{H}$ que contiene nuestros "estados físicos" (por definición). Para un físico, los "estados" se definen realmente de forma más vaga como "las cosas de las que obtenemos las mediciones", y el espacio de Hilbert existe porque queremos hablar de mediciones. Las mediciones corresponden a los valores propios de los operadores (por qué las cosas son "obviamente" así es una historia más larga...).

Así que tenemos un estado genérico $| \psi \rangle \in \mathcal{H}$ y un operador que corresponde a un observable $\mathcal{O}$ . Los valores medidos son

$\mathcal{O} |\psi\rangle = o_i | \psi \rangle$ .

Porque el $o_i$ son cantidades observables, es útil etiquetar los sistemas en función de ellas.

Podemos tener una lista de observables, $\mathcal{O}_j$ (que normalmente tomamos como conmutantes para poder diagonalizar simultáneamente), y entonces tenemos estados $|\psi\rangle$ ,

$\mathcal{O}_j | \psi \rangle = {o_i}_j | \psi \rangle$ .

Entonces, lo que decimos, es que podemos definir de forma única nuestros estados QM normales por un conjunto de valores propios $o_{ij}$ .

En otras palabras, el $o_{ij}$ definir estados, desde el punto de vista de la física. Realmente, esto define una base donde nuestros operadores son diagonales. Podemos -y lo hacemos- obtener estados que no tienen observables que puedan ser diagonalizados simultáneamente, esto ocurre en cosas como la oscilación de neutrinos, ¡y es por lo que pueden convertirse en diferentes tipos de neutrinos! Los neutrinos emitidos se emiten en estados con valores propios que no son diagonales en el operador que equivale al operador "especie de partícula". (Nota: también podríamos definir la "especie" como lo que se emite, y entonces los neutrinos no oscilarían en esta base (¡pero sí en otros!)

Esto tiene que ver con las representaciones, porque cuando hablamos de partículas con espín, por ejemplo, estamos hablando de operadores que corresponden al "momento angular". Tenemos un operador:

$L_z = i \frac{\partial}{\partial\phi}$

y etiquetar los valores propios por estados semienteros que corresponden físicamente al espín. En teoría de grupos, $L_z$ proviene del álgebra de mentiras del grupo de rotación, porque estamos hablando del momento angular (o espín) que tiene simetrías rotacionales asociadas.

Pasar de aquí a la teoría cuántica de campos (y especializarla en el modelo estándar) es técnicamente complicado, pero es básicamente lo mismo que ocurre aquí. La gran diferencia es que allí queremos hablar de "campos cuánticos" en lugar de estados, y tenemos que preocuparnos de cosas locas como valores aparentemente infinitos e integrales de dimensión infinita, que confunden la moraleja de la historia.

Pero la idea es simplemente, queremos identificar las cosas por medio de observables, que corresponden a valores propios, que corresponden a operadores, que corresponden a elementos del álgebra de mentira, que tienen un grupo de mentira asociado.

Así que definimos como "partículas" los estados correspondientes a cosas que se transforman bajo grupos físicamente convenientes.

Si quieres una descripción más cuidadosa desde el punto de vista matemático, que todavía tiene algo de intuición física, puedes consultar "Differential Geometry, Gauge theory, and Gravity" de Gockler y Schuker, que hace las cosas desde el punto de vista del haz, que es ligeramente diferente a lo que he descrito (porque describe las teorías de campo clásicas) pero la moraleja es similar. Al principio puede parecer sorprendente que la estructura clásica aquí sea la misma, cuando parecía que se basaba en operadores y estados en espacios de Hilbert, pero sólo se basaba técnicamente, pero moralmente, lo importante son las acciones bajo grupos de simetría. Y eso también está en la teoría clásica. Pero no está tan claro físicamente desde el principio desde ese punto de vista.

8voto

Bruce Westbury Puntos 6382

Tengo entendido que esto comenzó con la ecuación de onda de Dirac. Esta era una ecuación relativista para un electrón. Sin embargo, también introdujo la idea de que una partícula puntual podía tener un espacio de estado interno. Esta teoría tuvo éxito y fue retomada e imitada cuando se trató de sondear la estructura del núcleo.

Para una descripción del modelo estándar un buen lugar para empezar es: http://arxiv.org/abs/0904.1556

7voto

Solignis Puntos 181

Hay una excelente introducción de John Baez y John Huerta al Modelo Estándar y la teoría de los grupos de Lie en el Bulletin of the AMS, vol 47, no. 3, julio de 2010. En particular, da muchas referencias y notas históricas.

Acabo de darme cuenta de que este es el mismo artículo que el sugerido por Bruce, ¡lo siento!

4voto

Ken Wootton Puntos 910

Como físico, tal vez pueda dar una perspectiva diferente sobre esta cuestión. En particular, muchas de las respuestas hasta ahora han versado sobre la mecánica cuántica y la teoría cuántica de campos (que implican grupos de Lie), pero si la pregunta es: "¿Por qué el contenido de partículas de las teorías físicas se deriva de los grupos de Lie?", entonces la respuesta no se refiere específicamente a la cuántica de las teorías. Se trata de su geometría, que puede discutirse por separado de los efectos cuánticos.

En 1926, Kaluza y Klein intentaron unificar el electromagnetismo con la gravedad proponiendo una teoría de la relatividad general con 5 dimensiones (4 espaciales). Dado que no experimentamos macroscópicamente este grado de libertad extra, propusieron que es topológicamente como un cilindro con un radio pequeño, tan pequeño que el grado de libertad extra no puede ser sondeado como una dirección. Sin embargo, este grado de libertad nos permite codificar el electromagnetismo clásico como parte de la geometría del espacio-tiempo. Veremos en un momento que, aunque esta formulación no es exactamente correcta, muestra cómo los conceptos de geometría diferencial de la Relatividad General pueden utilizarse en las teorías de la física de partículas, lo que lleva a una unificación de las cuatro fuerzas a nivel clásico. (Es la cuantificación de la gravedad que es la parte difícil).

El Lagrangiano de la electrodinámica cuántica (finales de los años 40) no es más que el Lagrangiano de la ecuación de Dirac con un requisito adicional: que el campo espinor $\psi$ tiene un local $\mathcal{U}(1)$ simetría. Utilizaré la misma notación que el artículo de Wikipedia , excepto que usaré $c = \hbar = 1$ . El lagrangiano de Dirac

$\mathcal{L_D} = m\bar{\psi}\psi - \frac{i}{2}\left(\bar{\psi} \gamma^\mu (\partial_\mu\psi) - (\partial_\mu\bar{\psi}) \gamma^\mu \psi \right)$ (1)

tiene un $\mathcal{U}(1)$ simetría en que las fases complejas de los componentes de $\psi$ cancelar en el $\bar{\psi}\psi$ términos: multiplicando todas las instancias de $\psi$ por $e^{i\alpha}$ para alguna constante $\alpha$ no cambiaría el valor de $\mathcal{L}$ . La ecuación de Dirac no tiene un local $\mathcal{U}(1)$ simetría, es decir, la invariabilidad bajo

$\psi(x,t) \to e^{i\theta(x,t)} \psi(x,t)$ donde todo es una función de los puntos del espacio-tiempo 4-D $(x,t)$ (2).

Si queremos crear un nuevo lagrangiano que sí tenga una $\mathcal{U}(1)$ simetría, nos encontramos con que tendríamos que sustituir los operadores derivados $\partial_\mu$ con

$D_\mu = \partial_\mu - iqA_\mu$ (3)

donde $A$ es un nuevo campo con la propiedad de transformación

$A_\mu(x,t) \to A_\mu(x,t) + \frac{1}{q}\partial_\mu \theta(x,t)$ (4).

La nueva teoría tiene un Lagrangiano

$\mathcal{L_{QED}} = m\bar{\psi}\psi - \frac{i}{2}\left(\bar{\psi} \gamma^\mu (D_\mu\psi) - (D_\mu\bar{\psi}) \gamma^\mu \psi \right) + \frac{1}{4}\left((\partial_\mu A_\nu - \partial_\nu A_\mu)(\partial^\mu A^\nu - \partial^\nu A^\mu)\right)$ (5)

donde el último término es necesario para preservar la simetría bajo los impulsos de Lorentz (conservación de la energía en el nuevo $A$ campo). Sólo siguiendo las consecuencias de un $\mathcal{U}(1)$ simetría, hemos convertido la Lagrangiana de Dirac de flujo libre en la Lagrangiana electromagnética de interacción, donde podemos interpretar $\psi$ como ondas de partículas cargadas (por ejemplo, electrones) y $A$ como el potencial vectorial del electromagnetismo, es decir, las ondas fotónicas. La transformación de las ecuaciones (2) y (4) es la transformación gauge del electromagnetismo: hemos aprendido que la simetría gauge electromagnética es fundamentalmente una $\mathcal{U}(1)$ simetría.

Volviendo a la teoría de Kaluza y Klein, una 5ª dimensión compactada es un poco como tener una $\mathcal{U}(1)$ invarianza en cada punto del espacio de 4 dimensiones, ya que es difícil ver dónde estamos en el bucle de la 5ª dimensión. No es exactamente lo mismo: con una dimensión extra, en principio deberíamos poder realizar rotaciones en las que se mezclen las dimensiones espaciales y la dimensión extra, mientras que eso no sería posible en un espacio de 4 dimensiones más $\mathcal{U}(1)$ haz de fibras. (Esta diferencia quizás esté relacionada con la razón por la que la teoría original de Kaluza y Klein no funcionó...) Si generalizamos nuestra noción de espacio-tiempo para incluir el $\mathcal{U}(1)$ fibras, podemos pensar en el electromagnetismo y la relatividad general en los mismos términos. Por ejemplo, el campo de los fotones $A$ desempeña el mismo papel en el $\mathcal{U}(1)$ como la derivada de conexión/covariante en la simetría local de Lorentz de la métrica del espacio-tiempo. Es decir, el campo fotónico clásico es la "curvatura" del haz de fibras en el mismo sentido que la gravitación es la curvatura del espacio-tiempo.

Además, esta imagen que unifica la geometría del electromagnetismo con la geometría de la gravedad también funciona para todas las demás fuerzas conocidas. En 1954, Yang y Mills generalizó el "local $\mathcal{U}(1)$ -a-electromagnetismo" funcione para cualquier grupo de Lie, incluidos los no abelianos. La idea de Yang-Mills no fue muy popular al principio porque no parecía describir la fuerza nuclear fuerte (pero eso se basaba en la suposición errónea de que la fuerza nuclear es una interacción Yukawa). A finales de la década de 1960, Weinberg dedujo una teoría electrodébil unificada de los locales $\mathcal{SU}(2)\times\mathcal{U}(1)$ y Han y Nambu derivaron un teoría de la fuerza nuclear fuerte de $\mathcal{SU}(3)$ . (Estoy omitiendo muchas contribuciones importantes por razones de brevedad.) A mediados de los años 70 o principios de los 80, dependiendo de a quién pregunte, esto se conoció como el Modelo Estándar de la física de partículas debido a su éxito experimental.

Podemos pensar en el Modelo Estándar geométricamente como un $\mathcal{SU}(3)\times\mathcal{SU}(2)\times\mathcal{U}(1)$ en cada punto del espacio-tiempo 4-D, siendo el gluón, los bosones W y Z y el fotón conexiones a través de grupos en puntos vecinos del espacio-tiempo, organizándose constantemente para ocultar información sobre los componentes de los campos de materia en todos estos grados de libertad "internos". Las estructuras de los grupos son directamente responsables de las cargas e interacciones de los campos de materia (quarks y leptones), pero los propios campos de materia no se derivan de los grupos (la supersimetría podría cambiar esa parte del cuadro). Hay una analogía directa entre estas conexiones de grupo (el gluón, el W, el Z y el fotón) y la conexión espacio-tiempo en la Relatividad General (que podríamos llamar campo gravitón, si se quiere). En este punto no he dicho nada sobre la cuantización de todos estos campos, lo que complica aún más el panorama, ¡especialmente en el caso de la gravedad!

Por cierto, me encantaría saber más sobre la curvatura de los haces de fibras, para entender lo anterior a un nivel matemático más profundo. Si tienes alguna lectura sugerida, me interesa. Gracias.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X