31 votos

¿Por qué usar la notación de suma de Einstein?

La convención de suma de Einstein dicta que los índices repetidos deben ser sumados. Por lo tanto, la ecuación $a_{ij} = b_{ik}c_{kj}$ se interpreta como $a_{ij} = \sum_k b_{ik}c_{kj}$ donde en ambos casos el rango de la suma es implícito.

A menudo, cuando me he encontrado con esta notación, es seguida por la afirmación "donde la suma sobre el índice $k$ es implícita". Esto parece ir en contra del propósito de la notación de Einstein (reducir el desorden en las ecuaciones).

Otras veces, la suma no es obvia (como puede ser el caso anterior). Por ejemplo, si se pide evaluar $F^{\mu \nu}F_{\mu \nu}$, uno podría pensar que la respuesta depende de los valores de $\mu$ y $\nu, pero de hecho, se da por sentada la suma.

Dadas estas ambigüedades y el fallo en reducir el desorden (bueno, más bien intercambiando el desorden en las ecuaciones por desorden en el texto), ¿por qué uno debería usar la notación de Einstein?

37voto

rck Puntos 121

¿Qué es la notación de la suma de Einstein?

Mientras que Einstein pudo haberlo tomado simplemente como una convención para sumar "cualquier índice repetido", como Zev Chronocles insinuó en un comentario, tal convención de suma no satisfaría la propiedad de "hacer imposible escribir algo que no es independiente de las coordenadas" que los defensores de la convención a menudo reivindican.

En lenguaje geométrico moderno, uno debería pensar en la convención de suma de Einstein como una forma muy precisa de expresar los apareamientos/dualidades naturales al mirar un objeto multilineal.

Más precisamente: sea $V$ algún espacio vectorial y $V^*$ su dual. Existe una operación bilineal natural que toma $v\in V$ y $\omega\in V^*$ para obtener un valor escalar $\omega(v)$; esto podría ser también denotado como $\omega\cdot v$ o $\langle \omega,v\rangle$. Este apareamiento de dualidad también puede ser llamado contracción y a veces denotado por $\mathfrak{c}: V\otimes V^* \to \mathbb{R}$ (o diferente campo escalar si tu espacio vectorial está sobre algún otro campo).

Ahora, dejando $\eta$ ser un elemento arbitrario de $V^{p,q}:= (\otimes^p V)\otimes (\otimes^q V^*)$, siempre que $p,q$ sean ambos positivos, podemos hacer una contracción entre cualquier factor de $V$ contra cualquier otro factor de $V^*$. Cada una de estas contracciones da un mapeo $V^{p,q} \to V^{p-1,q-1}$, y es tedioso nombrar cada una de ellas (puedes indexar cada una llamando $\mathfrak{c}_{i,j}$ a la contracción entre el $i$-ésimo factor de $V$ con el $j$-ésimo factor de $V^*$).

La convención de Einstein evita esto siendo una convención de índices, donde $\eta$ se escribe como $\eta^{i_1\cdots i_p}_{j_1\cdots j_q}$, un objeto indexado, donde cada índice corresponde a uno de los factores $V$ o $V^*$. Luego, en lugar de $\mathfrak{c}_{i,j}$, simplemente traemos el factor relevante en el índice y trazamos sobre él. Por ejemplo $$ \mathfrak{c}_{1,1}(\eta)^{i_1\cdots i_{p-1}}_{j_1 \cdots j_{q-1}} = \eta^{k i_1\cdots i_{p-1}}_{k j_1 \cdots j_{q-1}} $$ donde el símbolo de sumatoria sobre $k$ está suprimido. Para un solo tensor la ventaja de esta notación no está clara, pero para múltiples contracciones, se ve la ventaja

$$ \mathfrak{c}_{1,1} \mathfrak{c}_{p,q} \eta = \mathfrak{c}_{p-1,q-1} \mathfrak{c}_{1,1} \eta $$

si $\eta \in V^{p,q}$. Básicamente, si tienes múltiples contracciones en una expresión, deberás hacer un seguimiento cuidadoso del nivel de contracciones para poner los índices correctos en el símbolo de contracción; en particular, los símbolos no son conmutativos. La misma expresión anterior en notación de Einstein sería simplemente

$$ \eta^{k i_1\cdots i_{p-2} \ell}_{k j_1\cdots j_{q-2} \ell} $$

y se ve inmediatamente qué huecos están contraídos juntos. Además, es evidente que las "fórmulas" obtenidas así son independientes de la elección de base de $V$ y $V^*$ (con respecto a la cual podemos escribir los componentes reales de $\eta).

¿Cuál es el uso correcto de la notación de Einstein?

  1. La notación de Einstein solo debería usarse para denotar la contracción de una ranura contravariante con una ranura covariante. Eso es todo. No sumes sobre dos ranuras covariantes. No uses índices triplicados. Si limitas su uso a estos tipos de contracciones, la estás usando para denotar una "operación natural" y por lo tanto nunca obtendrás expresiones que dependan de las coordenadas o no sean geométricas.
  2. Esto es especialmente un problema en configuraciones geométricas Lorentzianas u otras pseudo-Riemannianas, o en situaciones donde no tienes una métrica en absoluto. Que en geometría Riemanniana muchas veces podemos salirnos con hacer la contracción de un par de índices covariantes o un par de índices contravariantes es que hay un isomorfismo natural (dado por la métrica) entre $V$ y $V^*$ en esta situación. Además, en la convención usual este isomorfismo no "cambia de signo". En la situación sin ninguna métrica no hay isomorfismo preferido entre $V$ y $V^*$, y por lo tanto el mapa bilineal $V\otimes V\to \mathbb{R}$ necesariamente sería dependiente de las coordenadas. En el caso Lorentziano puede haber problemas de signo si no tienes cuidado.
  3. La convención de suma de Einstein aprovecha el hecho de que el apareamiento dual $\omega(v)$ puede expresarse primero tomando el producto tensorial $\omega\otimes v$ y luego haciendo la contracción. Por lo tanto, solo deberías usarlo cuando este procedimiento tenga sentido: no lo uses para hacer división elemento por elemento, por ejemplo.
  4. La convención de suma de Einstein debería usarse cuando no hay "manipulaciones dependientes de las coordenadas". En particular, si alguna vez encuentras la necesidad de hablar de un componente particular de un tensor cuando se expresa en un sistema de coordenadas particular, entonces no deberías usar la notación de Einstein. Alternativamente, deberías encontrar una forma invariante de expresar ese componente particular (por ejemplo, fijando una forma uno/vector distinguido y escribir el componente como la contracción de tu tensor contra esa forma uno o vector).

Alternativas

La notación de suma de Einstein trata principalmente sobre apareamientos entre $V$ y $V^*$, así que (a pesar de su probable origen) no deberías pensar en ella principalmente como una notación utilizada para despejar cálculos de componentes tensoriales en coordenadas locales, sino más bien como una forma de resolver eficientemente el problema de "¿qué dos ranuras estamos contrayendo nuevamente?"

Desde este punto de vista, las alternativas a la notación de Einstein son la "notación invariante" (no uses ningún índice; escribe todo en una manera libre de coordenadas) y la "notación diagramática de Penrose" (ver p. ej. https://es.wikipedia.org/wiki/Notación_gráfica_de_Penrose).

3voto

bea Puntos 16

La notación de Einstein es una implementación basada en coordenadas de notación de índice abstracto cuando hay un conjunto fijo de bases para todos los espacios vectoriales. Esto es lo mismo que las matrices son implementaciones basadas en coordenadas de aplicaciones lineales entre espacios vectoriales.

A su vez, la notación de índice abstracto es una notación muy conveniente para encadenar combinaciones complejas de funciones multilineales, y convertir fluidamente las entradas de las funciones multilineales en salidas y viceversa.

Las entradas de una función multilínea se pueden convertir en salidas y viceversa, al considerar ciertas entradas de la función como "fijas" y otras entradas como "libres". Cada vez que conviertes una entrada en una salida o viceversa, dualizas el espacio relevante. Por ejemplo, considera una función multilínea con 3 entradas: $$T(\cdot, \cdot, \cdot) : U \times V \times W \rightarrow \mathbb{R}.$$ Puede verse en su lugar como la siguiente función multilínea con los dos primeros espacios como entradas y el dual del tercer espacio como salida: \begin{align} &\tilde T(u,v) \mapsto T(u,v,\cdot), \\ &\tilde T : U \times V \rightarrow W^* \end{align}

Dada una colección de funciones multilíneas, las salidas de una pueden insertarse como entradas en otra siempre que los espacios sean compatibles, creando una red interconectada de funciones multilíneas.

Continuando con el ejemplo, supongamos que $S$ es otra función multilínea con $W^*$ como espacio de entrada: $$S:X \times W^* \mapsto \mathbb{R}.$$ Entonces se puede definir una nueva función multilínea componiendo las dos: $$(x,u,v) \mapsto S(x,\tilde{T}(u,v)).

A pesar de que esta combinación de funciones multilíneas es conceptualmente simple, resultaba engorrosa de escribir (requiriendo la definición de una función auxiliar $\tilde{T}$). En su lugar, se puede usar la notación de índice abstracto para escribir lo mismo de forma concisa como: $$T_{uvw}S_x^w.$$

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X