37 votos

Las transformaciones que preservan los intervalos son lineales en la relatividad especial

En casi todas las pruebas que he visto de las transformaciones de Lorentz se parte de la suposición de que las transformaciones requeridas son lineales. Me pregunto si hay una manera de demostrar la linealidad:

Demostrar que cualquier transformación del espaciotiempo $\left(y^0,y^1,y^2,y^3\right)\leftrightarrow \left(x^0,x^1,x^2,x^3\right)$ que preserva los intervalos, es decir, tal que

$$\left(dy^0\right)^2-\left(dy^1\right)^2-\left(dy^2\right)^2-\left(dy^3\right)^2=\left(dx^0\right)^2-\left(dx^1\right)^2-\left(dx^2\right)^2-\left(dx^3\right)^2$$

es lineal (suponiendo que los orígenes de ambas coordenadas coinciden). Es decir, demostrar que $\frac{\partial y^i}{\partial x^j}=L_j^i$ es constante en todo el espaciotiempo (es decir, demostrar que $\frac{\partial L_j^i}{\partial x^k}=0$ ).

Hasta ahora todo lo que he podido probar es que $g_{ij}L_p^iL_q^j=g_{pq}$ (donde $g_{ij}$ es el tensor métrico de la relatividad especial) y que $\frac{\partial L_j^i}{\partial x^k}=\frac{\partial L_k^i}{\partial x^j}$ . ¿Alguna otra idea?

30voto

Stefano Puntos 763

En retrospectiva, he aquí una breve prueba.

La métrica $g_{\mu\nu}$ es la métrica constante plana $\eta_{\mu\nu}$ en ambos sistemas de coordenadas. Por lo tanto, la correspondiente (definida de forma única) Símbolos de Levi-Civita Christoffel

$$ \Gamma^{\lambda}_{\mu\nu}~=~0$$

son cero en ambos sistemas de coordenadas. Es bien sabido que el símbolo de Christoffel no transformar como un tensor bajo una transformación local de coordenadas $x^{\mu} \to y^{\rho}=y^{\rho}(x)$ sino con un término no homogéneo, que se construye a partir de la segunda derivada de la transformación de coordenadas,

$$\frac{\partial y^{\tau}}{\partial x^{\lambda}} \Gamma^{(x)\lambda}_{\mu\nu} ~=~\frac{\partial y^{\rho}}{\partial x^{\mu}}\, \frac{\partial y^{\sigma}}{\partial x^{\nu}}\, \Gamma^{(y)\tau}_{\rho\sigma}+ \frac{\partial^2 y^{\tau}}{\partial x^{\mu} \partial x^{\nu}}. $$

Por lo tanto, todas las segundas derivadas son cero,

$$ \frac{\partial^2 y^{\tau}}{\partial x^{\mu} \partial x^{\nu}}~=~0, $$

es decir, la transformación $x^{\mu} \to y^{\rho}=y^{\rho}(x)$ es afín.

15voto

becko Puntos 1095

Tenía la sensación de que una prueba directa sería posible utilizando sólo la relación $\eta _{ij}\frac{\partial y^i}{\partial x^p}\frac{\partial y^j}{\partial x^q}=\eta _{pq}$ asumiendo simples propiedades de suavidad de la transformación y luego utilizando algunas maniobras de álgebra. Encontré el siguiente argumento encantador en el libro Gravitation and Cosmology de Steven Weinberg.

Partimos de la relación

$$\eta _{ij}\frac{\partial y^i}{\partial x^p}\frac{\partial y^j}{\partial x^q}=\eta _{pq}$$

Diferenciando con respecto a $x^k$ obtenemos

$$\eta _{ij}\frac{\partial ^2y^i}{\partial x^p\partial x^k}\frac{\partial y^j}{\partial x^q}+\eta _{ij}\frac{\partial y^i}{\partial x^p}\frac{\partial ^2y^j}{\partial x^q\partial x^k}=0$$

Añadimos a esto la misma ecuación con $p$ y $k$ intercambiados, y restar lo mismo con $q$ y $k$ intercambiados; es decir,

$$\eta _{ij}\left(\frac{\partial ^2y^i}{\partial x^p\partial x^k}\frac{\partial y^j}{\partial x^q}+\frac{\partial y^i}{\partial x^p}\frac{\partial ^2y^j}{\partial x^q\partial x^k}+\frac{\partial ^2y^i}{\partial x^k\partial x^p}\frac{\partial y^j}{\partial x^q}+\frac{\partial y^i}{\partial x^k}\frac{\partial ^2y^j}{\partial x^q\partial x^p}-\frac{\partial ^2y^i}{\partial x^p\partial x^q}\frac{\partial y^j}{\partial x^k}-\frac{\partial y^i}{\partial x^p}\frac{\partial ^2y^j}{\partial x^k\partial x^q}\right)=0$$

Esto se simplifica a

$$2\eta _{ij}\frac{\partial ^2y^i}{\partial x^p\partial x^k}\frac{\partial y^j}{\partial x^q}=0$$

Dado que los tensores $\frac{\partial y^i}{\partial x^j}$ y $\eta _{ij}$ son invertibles, esto implica que

$$\frac{\partial ^2y^i}{\partial x^p\partial x^k}=0$$

7voto

Stefano Puntos 763

Aquí sólo quiero mencionar que existe una prueba directa en $1+1$ dimensiones utilizando argumentos elementales. Sean los dos parches de coordenadas $U_x$ y $U_y$ (que son, por ejemplo, ambos conjuntos convexos en $\mathbb{R}^2$ que contiene el origen) tienen coordenadas de cono de luz $x^{\pm}$ y $y^{\pm}$ respectivamente. La métrica es

$$ dy^{+}dy^{-} ~=~ dx^{+}dx^{-}. $$

Esto conduce a tres PDE's

$$ \frac{\partial y^{+}}{\partial x^{+}} \frac{\partial y^{-}}{\partial x^{+}} ~=~0 \qquad \qquad\Leftrightarrow\qquad \qquad\frac{\partial y^{+}}{\partial x^{+}}~=~0 \qquad\mathrm{or}\qquad \frac{\partial y^{-}}{\partial x^{+}} ~=~0 ,$$ $$ \frac{\partial y^{+}}{\partial x^{-}} \frac{\partial y^{-}}{\partial x^{-}} ~=~0\qquad \qquad\Leftrightarrow \qquad\qquad\frac{\partial y^{+}}{\partial x^{-}}~=~0 \qquad\mathrm{or}\qquad \frac{\partial y^{-}}{\partial x^{-}} ~=~0,$$ $$ \frac{\partial y^{+}}{\partial x^{+}} \frac{\partial y^{-}}{\partial x^{-}} +\frac{\partial y^{+}}{\partial x^{-}} \frac{\partial y^{-}}{\partial x^{+}} ~=~1.$$

Desde $\det \frac{\partial y}{\partial x}\neq 0$ En realidad, sólo hay dos posibilidades. O bien

$$\frac{\partial y^{-}}{\partial x^{+}}~=~0 ~=~\frac{\partial y^{+}}{\partial x^{-}},$$

o

$$\frac{\partial y^{+}}{\partial x^{+}}~=~0 ~=~\frac{\partial y^{-}}{\partial x^{-}}.$$

Posiblemente reetiquetando $x^{+} \leftrightarrow x^{-}$ podemos suponer lo primero. Así que

$$y^{+}~=~f^{+}(x^{+})\qquad \mathrm{and} \qquad y^{-}~=~f^{-}(x^{-}).$$

De la tercera EDP, concluimos que

$$ \frac{\partial f^{+}}{\partial x^{+}}\frac{\partial f^{-}}{\partial x^{-}} ~=~1. $$

Por separación de variables, esto sólo es posible si $\frac{\partial f^{\pm}}{\partial x^{\pm}}$ es independiente de $x^{\pm}$ . De ello se desprende que $y^{\pm}~=~f^{\pm}(x^{\pm})$ son funciones afines. Q.E.D.

5voto

Philippe Gerber Puntos 181

Supongamos primero que el producto escalar que se conserva tiene signo positivo para mostrar la idea principal. Además, dices que no quieres suponer homogeneidad, pero esto ya está implícito en tu ecuación, ya que para formar intervalos se utilizan diferencias de puntos espacio-temporales, por lo que también podríamos tomar uno de esos puntos como cero de un espacio vectorial (equivalentemente, podrías estar hablando de la preservación de un producto escalar sobre un espacio tangente a un punto, pero esto también es lineal, no afín).

Dejemos que $$f : \mathbb R^2 \to \mathbb R^2, \quad (x,y) \mapsto (A(x,y), B(x,y))$$ sea conservadora de la longitud y supongamos que $f$ es analítico con $$A(x,y) = \sum_{n,m=0}^{\infty} {a_{n,m} \over n! m!} x^n y^m, \quad B(x,y) = \sum_{n,m=0}^{\infty} {b_{n,m} \over n! m!} x^n y^m.$$

Entonces tenemos $x^2 + y^2 = A(x,y)^2 + B(x,y)^2$ para todos $x,y \in \mathbb R^2$ o explícitamente primero $$ x^2 + y^2 = \left(\sum_{n,m=0}^{\infty} {a_{n,m} \over n! m!} x^n y^m \right)^2 + \left( \sum_{n,m=0}^{\infty} {b_{n,m} \over n! m!} x^n y^m \right)^2.$$ Esto demuestra inmediatamente que los únicos coeficientes no evanescentes se producen cuando $n+m \leq 1$ . Sólo tenemos que investigar $n=m=0$ pero esto es trivial ya que $f(0,0) = (a_{0,0}, b_{0,0})$ .

Para el $n$ D la discusión es completamente análoga. Para la firma arbitraria hay que tener cierto cuidado, ya que no podemos utilizar $x^2 + y^2 = 0 \rightarrow x = y =0$ más (tal vez se pueda trabajar en $\mathbb C$ en lugar de $\mathbb R$ y utilizar la continuación analítica).

El último ingrediente de este argumento es la analiticidad de $f$ . Pero esto es trivial ya que $||f(x,y)||^2 = x^2 + y^2$ y $||\cdot||^2$ son analíticas en torno a cualquier $(x,y) \in \mathbb R^2$ .

4voto

Stefano Puntos 763

Reformulemos la pregunta de la OP de la siguiente manera:

Demuestre que una transformación local de coordenadas $x^{\mu} \to y^{\rho}=y^{\rho}(x)$ entre dos sistemas de coordenadas locales (en una variedad lorentziana de 3+1 dimensiones) debe ser afín si la métrica $g_{\mu\nu}$ en ambos sistemas de coordenadas resultan estar en la forma plana constante de Minkowski $\eta_{\mu\nu}$ .

Aquí presentaremos una prueba que funciona tanto con la firma de Minkowski como con la de Euclides; de hecho, para cualquier firma y para cualquier número finito no nulo de dimensiones, siempre que la métrica $g_{\mu\nu}$ es invertible.

1) Recordemos primero la propiedad de transformación de la métrica inversa $g^{\mu\nu}$ que es una contravariante $(2,0)$ tensor simétrico,

$$ \frac{\partial y^{\rho}}{\partial x^{\mu}} g^{\mu\nu}_{(x)}\frac{\partial y^{\sigma}}{\partial x^{\nu}}~=~g^{\rho\sigma}_{(y)}, $$

donde $x^{\mu} \to y^{\rho}=y^{\rho}(x)$ es una transformación de coordenadas local. Recordemos que la métrica $g_{\mu\nu}=\eta_{\mu\nu}$ es la métrica constante plana en ambos sistemas de coordenadas. Así que podemos escribir

$$ \frac{\partial y^{\rho}}{\partial x^{\mu}} \eta^{\mu\nu}\frac{\partial y^{\sigma}}{\partial x^{\nu}}~=~\eta^{\rho\sigma}. \qquad (1) $$

2) Supongamos que la transformación local de coordenadas es analítica real

$$y^{\rho} ~=~ a^{(0)\rho} + a^{(1)\rho}_{\mu} x^{\mu} + \frac{1}{2} a^{(2)\rho}_{\mu\nu}x^{\mu}x^{\nu} + \frac{1}{3!} a^{(3)\rho}_{\mu\nu\lambda}x^{\mu} x^{\nu} x^{\lambda} + \ldots. $$

Realizando eventualmente una traslación adecuada, supondremos a partir de ahora, sin pérdida de generalidad, que el desplazamiento constante $ a^{(0)\rho} =0 $ es cero.

3) A la orden zerótica en $x$ la ecuación $(1)$ lee

$$ a^{(1)\rho}_{\mu} \eta^{\mu\nu}a^{(1)\sigma}_{\nu}~=~\eta^{\rho\sigma}, $$

que no es sorprendente que la matriz $a^{(1)\rho}_{\mu}$ es una matriz de Lorentz (o una ortogonal), respectivamente. Realizando eventualmente una "rotación" adecuada, supondremos a partir de ahora, sin pérdida de generalidad, que la matriz constante

$$ a^{(1)\rho}_{\mu}~=~\delta^{\rho}_{\mu} $$

es la matriz unitaria.

4) En lo sucesivo, será conveniente bajar el índice del $y^{\sigma}$ coordinar como

$$y_{\rho}~:=~\eta_{\rho\sigma}y^{\sigma}.$$

Entonces la transformación local de coordenadas se convierte en

$$y_{\rho} ~=~ \eta_{\rho\mu} x^{\mu} + \frac{1}{2} a^{(2)}_{\rho,\mu\nu}x^{\mu}x^{\nu} + \frac{1}{3!} a^{(3)}_{\rho,\mu\nu\lambda}x^{\mu} x^{\nu} x^{\lambda}+ \ldots$$ $$+\frac{1}{n!} a^{(n)}_{\rho,\mu_1\ldots\mu_n}x^{\mu_1} \cdots x^{\mu_n}+ \ldots. $$

5) Al primer orden en $x$ la ecuación $(1)$ lee

$$ a^{(2)}_{\rho,\sigma\mu}+a^{(2)}_{\sigma,\rho\mu}~=~0.$$

Eso es, $a^{(2)}_{\rho,\mu\nu}$ es simétrico en $\mu\leftrightarrow \nu$ pero antisimétrico en $\rho\leftrightarrow \mu$ . No es difícil ver (aplicando la propiedad de simetría y antisimetría en orden alterno tres veces cada una), que los coeficientes de segundo orden $a^{(2)}_{\rho,\mu\nu}=0$ debe desaparecer.

6) Al segundo orden en $x$ la ecuación $(1)$ lee

$$ a^{(3)}_{\rho,\sigma\mu\nu}+a^{(3)}_{\sigma,\rho\mu\nu}~=~0.$$

Eso es, $a^{(3)}_{\rho,\mu\nu\lambda}$ es simétrica en $\mu\leftrightarrow \nu\leftrightarrow \lambda $ pero antisimétrico en $\rho\leftrightarrow \mu$ . Para las instalaciones fijas $\lambda$ podemos llegar de nuevo a la conclusión $a^{(3)}_{\rho,\mu\nu\lambda}=0$ .

7) Del mismo modo, concluimos inductivamente que los coeficientes de orden superior $a^{(n)}_{\rho,\mu_1\ldots\mu_n}=0$ debe desaparecer también. Así que $y^{\mu}= x^{\mu}$ . Q.E.D.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X