Loading [MathJax]/extensions/TeX/newcommand.js

22 votos

Inversa y transpuesta de la transformación de Lorentz

He visto esta pregunta varias veces en Stack Exchange, pero sigo bastante confundido por qué parece surgir la siguiente "contradicción".

Por definición:

  1. (ΛT)μν=Λνμ
  2. ΛTηΛ=η que es ΛρμηρσΛσν=ημν en notación de índice.

Podemos manipular aún más la segunda definición (como se hace en Notas de la conferencia de Tong ):

ΛρμηρσΛσν=ημνΛρμΛρν=ημνΛρμΛρνηνσ=ημνηνσΛρμΛρσ=δσμΛρσΛρμ=δσμ

Recordando que (Λ1)σρ se define a través de:

(Λ1)σρΛρμ=δσμ

Esto implica que (Λ1)σρ=Λρσ pero según la definición 1, no (ΛT)σρ=Λρσ ? Esto parece implicar incorrectamente que (ΛT)σρ=(Λ1)σρ. No estoy muy seguro de qué paso de mi lógica es incorrecto.

Tong hace el siguiente comentario sobre el resultado (A):

El resultado es análogo a la afirmación de que la inversa de una matriz de rotación es la matriz de transposición. Para las transformaciones generales de Lorentz, aprendemos que la inversa es más o menos la transpuesta, donde "más o menos" significa que hay signos menos de elevación y reducción. La colocación de los índices nos dice dónde van esos signos menos.

Este comentario parece sugerir que (B) es incorrecta - aunque sólo parece una mera aplicación de la definición 1.

Edito para aclarar la pregunta tras las respuestas iniciales:

A partir de este análisis, ¿por qué es incorrecto concluir que Λ1=ΛT ? Sabemos que esta ecuación matricial no es cierta, pero ¿por qué no está implícita en (ΛT)σρ=Λρσ=(Λ1)σρ ya que los índices en ΛT y Λ1 ¿son iguales?

Pregunta aclaratoria adicional:

Algunas de las respuestas revelarán que, de hecho, sólo la ecuación matricial D es incorrecta porque la estructura de índices de Λ es Λμν la estructura de índices de Λ1 es (Λ1)μν pero la estructura de índices de ΛT es (ΛT)μν ( no (ΛT)μν ).

Sin embargo, esto nos deja una última pregunta: ¿cómo podemos demostrar explícitamente que la matriz ΛT debería corresponder a esta estructura de índices diferente? El uso de esta estructura hace que todo vuelva a ser coherente, pero ¿cómo se deduce esto de la definición de la matriz Λ como correspondiente a Λμν ?

14voto

shawmanz32na Puntos 113

Después de un debate muy útil en la sección de comentarios y de leer las respuestas, he pensado en escribir (desde mi punto de vista) lo que he aprendido por si puede ayudar a alguien con la misma pregunta.

(ΛT)σρ=Λρσ=(Λ1)σρ

es, de hecho, una afirmación correcta, pero tenemos que tener cuidado al convertirla de nuevo en una ecuación matricial.

Debemos interpretar Λ como Λμν , Λ1 como (Λ1)μν , pero ΛT debe interpretarse como (ΛT)μν .

Por lo tanto, no podemos interpretar (ΛT)σρ como ΛT por lo que la ecuación D es incorrecta. En su lugar, utilizando la métrica (ΛT)σρ=ησα(ΛT)αβηβρ . Por lo tanto, en lugar de la ecuación matricial D, en realidad deberíamos tener:

Λ1=ηΛTη

10voto

user8142 Puntos 6

\def\th{\theta} \def\sp{\hspace{1ex}} \def\b{\beta} \def\a{\alpha} \def\m{\mu} \def\n{\nu} \def\g{\gamma} \def\d{\delta} \def\mt{\eta} \def\mti{\mt^{-1}} \def\F{\Phi} \def\Ft{\widetilde{\F}} \def\L{\Lambda} \def\Li{\L^{-1}} \def\Lt{\L^T} \def\id{\mathbb{I}} Del intervalo invariante se deriva \begin{align*} \L^\b_{\sp\a} \mt_{\b\g} \L^\g_{\sp\d} &= \mt_{\a\d}.\tag{1} \end{align*} Sea \F_\a^{\sp\b}=\L^\b_{\sp\a} por lo que (1) se escribe como \begin{align*} \F_\a^{\sp\b} \mt_{\b\g} \L^\g_{\sp\d} &= \mt_{\a\d}\tag{2} \end{align*} con interpretación matricial \begin{align*} \F\mt\L=\mt.\tag{3} \end{align*} Por gimnasia de índices (2) se masajea en la forma \F^\a_{\sp\g} \L^\g_{\sp\d} = \d^\a_\d así que \F^\a_{\sp\b} = (\Li)^\a_{\sp\b} . Obsérvese que, críticamente, el primer índice ha subido y el último ha bajado. En \Ft sea la matriz determinada por \F^\a_{\sp\b} tenemos \Ft=\Li. No obstante, nos interesa \F_\a^{\sp\b} . Encontramos \F_\a^{\sp\b} = \mt_{\g\a}\F^\g_{\sp\d}\mt^{\b\d} = \mt_{\g\a}(\Li)^\g_{\sp\d}\mt^{\b\d} . Esto tiene la interpretación matricial \begin{align*} \F &= \mt\Li\mti. \tag{4} \end{align*} De hecho, (4) se deduce inmediatamente de (3), lo que ilustra la utilidad de la representación matricial. La confusión se reduce a una entre \F y \Ft . A partir de (4) y de la forma general de \L que \F=\Lt . (Véase el comentario más abajo). Así, \Lt\mt\L=\mt es la representación matricial correcta de (1).

Ilustremos la diferencia entre \F y \Ft con un ejemplo concreto no trivial. Representar \L^\a_{\sp\b} por \L = \left[ \begin{array}{cccc} \gamma & 0 & 0 & -\beta \gamma \\ 0 & \cos \theta & -\sin \theta & 0 \\ 0 & \sin \theta & \cos \theta & 0 \\ -\beta \gamma & 0 & 0 & \gamma \\ \end{array} \right]. Entonces \F = \Lt = \left[ \begin{array}{cccc} \gamma & 0 & 0 & -\beta \gamma \\ 0 & \cos \theta & \sin \theta & 0 \\ 0 & -\sin \theta & \cos \theta & 0 \\ -\beta \gamma & 0 & 0 & \gamma \\ \end{array} \right]. Pero \Ft = \Li = \left[ \begin{array}{cccc} \gamma & 0 & 0 & \beta \gamma \\ 0 & \cos \theta & \sin \theta & 0 \\ 0 & -\sin \theta & \cos \theta & 0 \\ \beta \gamma & 0 & 0 & \gamma \\ \end{array} \right]. (Esto supone un impulso en la z dirección y rotación alrededor del z -eje).

Comentario

Cuando se estudian las soluciones generales de (1) se comprueba que son combinaciones de rotaciones y aumentos. Obsérvese que para una rotación \mt \L(\th)^{-1}\mti=\mt\L(-\th)\mti=\L(-\th)=\L(\th)^T y que para un impulso, \mt \L(\b)^{-1}\mt=\mt \L(-\b)\mti= \L(\b)=\L(\b)^T .

7voto

Stefano Puntos 763
  1. Obsérvese que la definición convencional de matriz transpuesta (\Lambda^T)_{\nu}{}^{\mu} ~:=~ \Lambda^{\mu}{}_{\nu}.\tag{1'} es ligeramente diferente de la definición de OP (1).

  2. En pocas palabras: Cuando no aplicamos la métrica, el Matriz de Lorentz \Lambda tiene índices convencionalmente inclinados NW-SE, mientras que la matriz transpuesta \Lambda^T tiene índices inclinados hacia el SW-NE.

    Véase también, por ejemplo este & este post relacionado de Phys.SE.

  3. Por cierto, la ec. (1) de OP es coherente con la ec. (1') después de subir y bajar los índices adecuadamente con la métrica.

  4. La ec. (D) de OP es incorrecta porque no cumple con la convención anterior.

  5. Más información: En forma matricial, las ecs. (A)-(C) de OP son las siguientes \Lambda^{-1}~=~ (\eta\Lambda\eta^{-1})^T,\tag{A} \eta^{-1}\Lambda^T\eta~=~ (\eta\Lambda\eta^{-1})^T,\tag{B} \eta^{-1}\Lambda^T\eta~=~\Lambda^{-1},\tag{C} respectivamente, que son todas verdaderas. La ec. (C) se deduce de la definición \Lambda^T\eta\Lambda~=~\eta de un Matriz de Lorentz .

6voto

Andy Denley Puntos 11

Creo que la razón por la que esto es confuso es que las notaciones tensorial y matricial se están mezclando de formas que en realidad no tienen sentido. Además, la notación no tiene en cuenta que la transformación de Lorentz lleva un sistema de coordenadas a otro. Normalmente se necesitaría un primo en cualquiera de los dos \mu o \nu (se habla de coordenadas imprimadas y no imprimadas). La transformación de Lorentz es un caso particular de una transformación general de coordenadas, que se puede escribir

k^{\mu'}_\nu = x^{\mu'}_{,\nu} = \frac{\partial x^{\mu'} }{\partial x^{\nu}}

En tal caso {\mu'} recorre filas y {\nu} pasa por encima de las columnas. No importa qué índice sea "primero" (yo prefiero definitivamente cuentas como la de Dirac, Teoría General de la Relatividad que explícitamente no pone primero ninguno de los índices en este caso). La transposición intercambiaría los índices covariante y contravariante, lo que convierte tu definición 1 en un sinsentido. La transposición se utiliza para matrices, porque el orden de los índices es importante para la multiplicación de matrices. Pero en relatividad general esto ya se tiene en cuenta en la notación de índices mediante la convención de suma de Einstein. No recuerdo que ninguno de mis textos preferidos de gtr utilice la transposición, pero tengo que confesar que si un autor la utilizara, creo que rápidamente buscaría otro autor.

4voto

Seregwethrin Puntos 109

El problema aquí es que tu definición (1) es incorrecta si la métrica no es la identidad en tus coordenadas. La única forma correcta de subir/bajar índices es por contracción con la métrica.

Una simple prueba de que tu definición no puede ser correcta: Supongamos que nuestra métrica es \def\d{{\rm d}}\d s^2={\d x^2\over4}-\d v^2 y \Lambda_\mu{}^\sigma=\begin{bmatrix}5\over4&3\over2\\3\over8&5\over4\end{bmatrix} .

Entonces su definición da \Lambda^\mu{}_\sigma=\begin{bmatrix}5\over4&3\over8\\3\over2&5\over4\end{bmatrix} mientras que el mío da \Lambda^\mu{}_\sigma=\begin{bmatrix}5\over4&-{3\over2}\\-{3\over8}&5\over4\end{bmatrix} .

Entonces si usas tu definición para evaluar \Lambda^\rho{}_\mu\eta_{\rho\sigma}\Lambda^\sigma{}_\nu se obtiene \begin{bmatrix}-{119\over64}&-{225\over128}\\-{225\over128}&-{391\over256}\end{bmatrix} ; si usas el mío, obtienes \begin{bmatrix}1\over4&0\\0&-1\end{bmatrix} .

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X