24 votos

Tensores: Actuando sobre Vectores vs Mapas Multilineales

Tengo la sensación de que hay dos definiciones muy diferentes de lo que es un producto tensorial. Estaba leyendo a Spivak y algunos otros textos similares al cálculo, donde el producto tensorial se define como $(S \otimes T)(v_1,...v_n,v_{n+1},...,v_{n+m})= S(v_1,...v_n) * T(v_{n+1},...,v_{n+m})$

La otra definición que leí en un libro sobre computación cuántica, está definida para vectores y matrices y tiene varios nombres, "producto tensorial, producto de Kronecker y producto exterior": http://en.wikipedia.org/wiki/Outer_product#Definition_.28matrix_multiplication.29

Encuentro esto realmente molesto y confuso. En la primera definición, estamos tomando productos tensores de operadores multilineales (los operadores actúan sobre vectores) y en la segunda definición la operación ES CON vectores y matrices. Me doy cuenta de que las matrices son operadores pero las matrices no son multilineales. ¿Hay alguna conexión entre estas definiciones?

1 votos

Las matrices son bilineales. Es decir, para cada matriz $A$, existe la aplicación bilineal $L(x, y) = x^TAy$.

1 votos

Okay.... even still.... ¿Puedes descomponer este mapa bilineal? L(x,y)=L_1(x)*L_2(y)? Además, (x^T)y \in R, así que x^T es un vector dual. ¡Seguro.... pero este comentario no revela nada nuevo para mí.

1 votos

Estoy de acuerdo en que la situación es confusa. La versión corta es que algunos libros de cálculo multivariable utilizan una convención que es opuesta a la que se usa en el resto de las matemáticas puras.

45voto

Jesse Madnick Puntos 13166

Comencemos primero estableciendo algunos conceptos.

Sea $V$ un espacio vectorial real de dimensión $n$, y sea $V^*$ su espacio dual. Definimos $V^k = V \times \cdots \times V$ (repetido $k$ veces).

  • Un tensor de tipo $(r,s)$ en $V$ es una aplicación multilineal $T\colon V^r \times (V^*)^s \to \mathbb{R}$.

  • Un tensor covariante de orden $k$ en $V$ es una aplicación multilineal $T\colon V^k \to \mathbb{R}$.

En otras palabras, un tensor covariante de orden $k$ es un tensor de tipo $(k,0)$. Esto es a lo que Spivak se refiere simplemente como un "$k$-tensor".

  • Un tensor contravariante de orden $k$ en $V$ es una aplicación multilineal $T\colon (V^*)^k\to \mathbb{R}$.

En otras palabras, un tensor contravariante de orden $k$ es un tensor de tipo $(0,k).

  • Denotamos por $T^r_s(V)$ al espacio vectorial de tensores de tipo $(r,s)$. Entonces, en particular,

$$\begin{align*} T^k(V) := T^k_0(V) & = \{\text{tensores covariantes de orden $k$}\} \\ T_k(V) := T^0_k(V) & = \{\text{tensores contravariantes de orden $k$}\}. \end{align*}$$ Dos casos especiales importantes son: $$\begin{align*} T^1(V) & = \{\text{tensores covariantes de orden $1$}\} = V^* \\ T_1(V) & = \{\text{tensores contravariantes de orden $1$}\} = V^{**} \cong V. \end{align*}$$ Esta última línea significa que podemos considerar los vectores $v \in V$ como tensores contravariantes de orden 1. Es decir, cada vector $v \in V$ se puede ver como una funcional lineal $V^* \to \mathbb{R}$ mediante $$v(\omega) := \omega(v),$$ donde $\omega \in V^*$.

  • La dimensión de un tensor de tipo $(r,s)$ se define como $r+s$.

En particular, los vectores (tensores contravariantes de orden 1) y los vectores duales (tensores covariantes de orden 1) tienen dimensión 1.


Si $S \in T^{r_1}_{s_1}(V)$ es un tensor de tipo $(r_1,s_1)$, y $T \in T^{r_2}_{s_2}(V)$ es un tensor de tipo $(r_2,s_2)$, podemos definir su producto tensorial $S \otimes T \in T^{r_1 + r_2}_{s_1 + s_2}(V)$ como

$$(S\otimes T)(v_1, \ldots, v_{r_1 + r_2}, \omega_1, \ldots, \omega_{s_1 + s_2}) = \\ S(v_1, \ldots, v_{r_1}, \omega_1, \ldots,\omega_{s_1})\cdot T(v_{r_1 + 1}, \ldots, v_{r_1 + r_2}, \omega_{s_1 + 1}, \ldots, \omega_{s_1 + s_2}).$$

Tomando $s_1 = s_2 = 0$, recuperamos la definición de Spivak como un caso especial.

Ejemplo: Sean $u, v \in V$. Nuevamente, dado que $V \cong T_1(V)$, podemos considerar $u, v \in T_1(V)$ como tensores de tipo $(0,1)$. Su producto tensorial $u \otimes v \in T_2(V)$ es un tensor de tipo $(0,2)$ definido por $$(u \otimes v)(\omega, \eta) = u(\omega)\cdot v(\eta)$$


Como sugerí en los comentarios, cada aplicación bilineal - es decir, cada tensor de dimensión 2, ya sea de tipo $(0,2)$, $(1,1)$ o $(2,0)$ - puede considerarse como una matriz, y viceversa.

Admitidamente, a veces la notación puede ser limitante. Es decir, estamos acostumbrados a considerar los vectores como vectores columna, y los vectores duales como vectores fila. Así que, cuando escribimos algo como $$u^\top A v,$$ nuestra notación sugiere que $u^\top \in T^1(V)$ es un vector dual y que $v \in T_1(V)$ es un vector. Esto significa que la aplicación bilineal $V \times V^* \to \mathbb{R}$ dada por $$(v, u^\top) \mapsto u^\top A v$$ es un tensor de tipo $(1,1)$.

Ejemplo: Sea $V = \mathbb{R}^3$. Escribamos $u = (1,2,3) \in V$ en la base estándar, y $\eta = (4,5,6)^\top \in V^*$ en la base dual. Para las entradas, también podemos escribir $\omega = (x,y,z)^\top \in V^*$ y $v = (p,q,r) \in V$. Entonces $$\begin{align*} (u \otimes \eta)(\omega, v) & = u(\omega) \cdot \eta(v) \\ & = \begin{pmatrix} 1 \\ 2 \\ 3 \end{pmatrix} (x,y,z) \cdot (4,5,6) \begin{pmatrix} p \\ q \\ r \end{pmatrix} \\ & = (x + 2y + 3z)(4p + 5q + 6r) \\ & = 4px + 5 qx + 6rx \\ & \ \ \ \ \ 8py + 10qy + 12py \\ & \ \ \ \ \ 12pz + 15qz + 18rz \\ & = (x,y,z)\begin{pmatrix} 4 & 5 & 6 \\ 8 & 10 & 12 \\ 12 & 15 & 18 \end{pmatrix}\begin{pmatrix} p \\ q \\ r \end{pmatrix} \\ & = \omega \begin{pmatrix} 4 & 5 & 6 \\ 8 & 10 & 12 \\ 12 & 15 & 18 \end{pmatrix} v. \end{align*}$$

Conclusión: El tensor $u \otimes \eta \in T^1_1(V)$ es la aplicación bilineal $(\omega, v)\mapsto \omega A v$, donde $A$ es la matriz $3 \times 3$ anterior.

El artículo de Wikipedia al que enlazaste entonces consideraría que la matriz $A$ es igual al producto tensorial $u \otimes \eta$.


Finalmente, debo señalar dos cosas que podrías encontrar en la literatura.

Primero, algunos autores toman la definición de un tensor de tipo $(r,s)$ como una aplicación multilineal $V^s \times (V^*)^r \to \mathbb{R}$ (nota que $r$ y $s$ están invertidos). Esto también significa que algunos índices estarán elevados en lugar de estar disminuidos, y viceversa. Simplemente tendrás que verificar las convenciones de cada autor cada vez que leas algo.

Segundo, nota que también existe una noción de productos tensoriales de espacios vectoriales. Muchos libros de texto, en particular aquellos centrados en álgebra abstracta, consideran esto como el concepto central. No entraré en esto aquí, pero ten en cuenta que hay un isomorfismo $$T^r_s(V) \cong \underbrace{V^* \otimes \cdots \otimes V^*}_{r\text{ copias}} \otimes \underbrace{V \otimes \cdots \otimes V}_{s \text{ copias}}.$$

De manera confusa, algunos libros de geometría diferencial definen el producto tensorial de espacios vectoriales de esta manera, pero creo que esto se está volviendo más raro.

5 votos

+2 ¡Es una excelente respuesta!

0 votos

Gran explicación, la encontré extremadamente útil. Solo me pregunto si el ejemplo en la tercera sección/párrafo está faltando alguna adición en las tres líneas (cuarto paso del ejemplo)?

0 votos

@BertZangle: Ah, sí, parece que me olvidé de dos signos $+$. Error tipográfico.

3voto

No puedo comentar aún (o no sé cómo hacerlo, si es que puedo), pero hago eco de la respuesta de Thomas y quiero agregar una cosa.

El producto tensorial de dos espacios vectoriales (o más generalmente, módulos sobre un anillo) es una construcción abstracta que te permite "multiplicar" dos vectores en ese espacio. Una introducción muy legible y motivada se da en el libro de Dummit & Foote. (Siempre pensé que la construcción real parecía muy extraña antes de leer en D&F, logran hacerla intuitiva y motivada como el intento de extender el conjunto de escalares con los que puedes multiplicar).

La colección de funciones $k$-multilineales en un espacio vectorial es en sí misma un espacio vectorial: cada mapa multilineal es un vector de ese espacio. La conexión entre las dos definiciones aparentemente diferentes es que estás realizando el producto tensorial "abstracto" en esos espacios de mapas multilineales.

Siempre me pareció que la definición del producto tensorial en Spivak era un ejemplo particularmente bueno y concreto de la definición más general y abstracta.

3voto

Esto no está destinado a ser una respuesta, pero no cabrá en un comentario. Me gustaría mencionar dos cosas aquí.

En primer lugar, aunque realmente estás abordando un tema que parece ser una fuente infinita de confusión y que seguramente es un dolor para la mayoría de estudiantes que comienzan a experimentar con él, también creo que deberías reaccionar un poco menos ignorante en un comentario (el dado por Jesse Madnick), el cual, si le das algunos momentos de reflexión, bien podría ayudarte a comprender mejor el problema. Además, en matemáticas, enojarse y estar molesto nunca ayuda. Por esto, realmente estoy considerando votar negativamente tu pregunta.

En segundo lugar, siempre que estés en el ámbito de los espacios vectoriales sobre los números reales o complejos, todas las definiciones de productos tensoriales que encuentres serán equivalentes, a menos que una esté realmente en error. Esto, admisiblemente, no siempre es obvio, especialmente para el principiante. Esto se debe al hecho de que, por un lado, el producto tensorial es algo bastante abstracto en el álgebra lineal (una solución universal a cierto tipo de pregunta abstracta, a saber, representar un mapa multilineal por otros lineales de manera universal), mientras que, por otro lado, resulta ser una construcción bastante importante con la necesidad de operaciones prácticas en áreas como la geometría diferencial y, por ejemplo, aplicaciones a la física (donde generalmente va acompañado de la dificultad adicional de que se necesita la construcción para haces, en lugar de para simples espacios vectoriales).

Si deseas ver por qué las diferentes construcciones son equivalentes, deberías dedicar algo de tiempo, encontrar algún tratamiento sobre álgebra multilineal (quizás pedir consejo sobre cuál usar aquí) y leerlo, y luego intentar descubrir cómo encajan las diversas definiciones que encontraste en el panorama. Cuando tu interés esté en la geometría diferencial (riemanniana), asegúrate de obtener una comprensión decente del isomorfismo entre el espacio tangente de una variedad y su dual inducido por la métrica riemanniana, y la forma en que esto se refleja en las coordenadas y otras notaciones. Todo esto será, admitidamente, un poco aburrido y doloroso.

De lo contrario, si no quieres invertir el tiempo, trata las diferentes definiciones como conceptos diferentes. Si realmente trabajas con ellas durante un tiempo, verás la forma en que se corresponden entre sí a medida que pase el tiempo.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X