15 votos

La motivación para el producto tensor en la Física

Esta pregunta es acerca de un objeto matemático (el producto tensor) pero el pensamiento acerca de la motivación que proviene de la Física. Algebraists motivar el producto tensor como que: "dada la $k$ espacios vectoriales $V_1,\dots,V_k$ sobre el mismo campo de $\Bbb K$ queremos encontrar un nuevo espacio de $S$ y universal multilineal mapa de $T$ tal que para cada espacio vectorial $W$ y multilineal asignación de $g : V_1\times\cdots\times V_k\to W$ tenemos un lineal mapa de $f : S\to W$ tal que $g = f\circ T$".

A continuación, demuestran que esta cosa existe por construcción. Ellos toman el libre espacio vectorial $\mathcal{M}=F(V_1\times\cdots\times V_k)$ y consideremos el subespacio $\mathcal{M}_0$ se extendió por todos los elementos de la forma

$$(v_1,\dots,v_i'+av_i'',\dots,v_k)-(v_1,\dots,v_i',\dots,v_k)-a(v_1,\dots,v_i'',\dots,v_k),$$

y definir $S=\mathcal{M}/\mathcal{M_0}$ denotando $S=V_1\otimes\cdots\otimes V_k$ y definen $T(v_1,\dots,v_k)=(v_1,\dots,v_k)+\mathcal{M}_0$ y la denotamos por a $T(v_1,\dots,v_k)=v_1\otimes\cdots\otimes v_k$.

Eso está bien, pero tensores aparecen mucho en la Física. En la Relatividad General, en la Electrodinámica, en la Mecánica Clásica, la Mecánica Cuántica, etc. Así que, si alguien me preguntó: "¿cuál es la motivación para que la definición de tensor de prodct" y he querido motivar a través de la Física, lo que debería ser la motivación?

¿Cómo puedo convencer a mi mismo de que el producto tensor definido como el que es útil en la Física?

Yo sé que uno puede definido tensores como multilineal mapas, y que es mucho más intuitivo, sin embargo estoy de interés para ver la manera de motivar a esta definición.

25voto

Nathan Feger Puntos 7675

Esencialmente, es imposible responder a la pregunta general "¿cómo se hace la multilinealidad vienen de forma natural en la física?" debido a la gran cantidad de ejemplos posibles que conforman el total de la respuesta. En su lugar, permítanme describir una situación en la que la voz que clama por el uso del tensor de productos de dos vectores.

Considere el problema de la conservación del momento para una distribución continua de carga eléctrica y corriente, que interactúa con un campo electromagnético, bajo la acción de ninguna otra fuerza externa. Voy a describir más o menos a lo largo de las líneas de Jackson (Electrodinámica Clásica, 3rd edición, §6.7), pero parten de él hacia el final. De esta manera se consigue muy electromagneticky por un tiempo, así que si quieres saltar a la tensores, usted puede ir directamente a la ecuación (1).

La tasa de cambio del total de la mecánica impulso del sistema es el total de la fuerza de Lorentz, dada por $$ \frac{ d\mathbf{P}_\rm{mech}}{dt} =\int_V(\rho\mathbf{E}+\mathbf{J}\times \mathbf{B})d\mathbf{x}. $$ Para simplificar esto, uno puede tomar la $\rho$ $\mathbf{J}$ de las ecuaciones de Maxwell: $$ \rho=\epsilon_0\nabla\cdot\mathbf{E} \ \ \ \text{ y }\ \ \ \mathbf{J}=\frac1{\mu_0}\nabla\times \mathbf{B}-\epsilon_0\frac{\partial \mathbf{E}}{\partial t}.$$ (En particular, esto significa que lo que sigue es sólo válido "en la shell": el impulso sólo se conserva si las ecuaciones de movimiento correspondientes. Por supuesto!)

Entonces, uno puede poner a estas expresiones de la espalda, a un buen cálculo vectorial, y llegar a la siguiente relación: $$ \begin{align}{} \frac{ d\mathbf{P}_\rm{mech}}{dt} +&\frac{d}{dt}\int_V\epsilon_0\mathbf{E}\times \mathbf{B}d\mathbf{x} \\ &= \epsilon_0\int_V \left[ \mathbf{E}(\nabla\cdot \mathbf{E})-\mathbf{E} \times(\nabla \times \mathbf{E}) + c^2 \mathbf{B} (\nabla \cdot \mathbf{B})- c^2 \mathbf{B} \times (\nabla \times \mathbf{B}) \right]d\mathbf{x}. \end{align} $$

La integral en el lado izquierdo puede ser identificado como el total de impulso electromagnético, y se diferencia de la integral del vector de Poynting por un factor de $1/c^2$. Para conseguir esto en la forma adecuada para una ley de conservación, a pesar de que, como el de la energía en esta configuración, $$ \frac{dE_\rm{mech}}{dt} +\frac{d}{dt}\frac{\epsilon_0}{2}\int_V(\mathbf{E}^2 +c^2\mathbf{B}^2)d\mathbf{x} = -\oint_S \mathbf{S}\cdot d\mathbf{a}, $$ necesitamos reducir la enorme, feo volumen integral en una superficie integral.

La manera de hacer esto es, por supuesto, el teorema de la divergencia. Sin embargo, que es el teorema de escalares, y lo que tenemos hasta ahora es una ecuación vectorial. A seguir trabajando entonces, tenemos que (al menos temporalmente) el trabajo en algunas de las bases específicas $\{\mathbf{e}_1,\mathbf{e}_2,\mathbf{e}_3\}$, y escribir $\mathbf{E}=\sum_i E_i \mathbf{e}_i$. Vamos a trabajar con el campo eléctrico plazo; después de que los resultados también se aplican a la magnética plazo. Por lo tanto, para empezar, $$ \begin{align}{} \int_V \left[ \mathbf{E}(\nabla\cdot \mathbf{E})-\mathbf{E} \times(\nabla \times \mathbf{E}) \right]d\mathbf{x} = \sum_i \mathbf{e}_i \int_V \left[ E_i(\nabla\cdot \mathbf{E})-\mathbf{e}_i\cdot\left(\mathbf{E} \times(\nabla \times \mathbf{E})\right) \right]d\mathbf{x}. \end{align} $$ Estos términos deben ser simplificado mediante el cálculo vectorial identidades $$ E_i(\nabla\cdot \mathbf{E}) = \nabla\cdot\left(E_i \mathbf{E}\right) - \mathbf{E}\cdot \nabla E_1 $$ y $$ \mathbf{E} \times(\nabla \times \mathbf{E}) = \frac12\nabla(\mathbf{E}\cdot\mathbf{E})-(\mathbf{E}\cdot\nabla)\mathbf{E}, $$ lo que significa que la combinación puede ser simplificado como $$ \begin{align}{} \int_V \left[ \mathbf{E}(\nabla\cdot \mathbf{E})-\mathbf{E} \times(\nabla \times \mathbf{E}) \right]d\mathbf{x} = \sum_i \mathbf{e}_i \int_V \left[ \nabla\cdot\left(E_i \mathbf{E}\right) - \mathbf{e}_i\cdot\left( \frac12\nabla(\mathbf{E}\cdot\mathbf{E}) \right) \right]d\mathbf{x}, \end{align} $$ dado que los términos en $\mathbf{E}\cdot \nabla E_i$ $\mathbf{e}_i\cdot\left( (\mathbf{E}\cdot\nabla)\mathbf{E}\right)$ cancelar. Esto significa que podemos escribir todo el integrando como la divergencia de algunos vectores de campo, y utilizar el teorema de la divergencia: $$ \begin{align}{} \int_V \left[ \mathbf{E}(\nabla\cdot \mathbf{E})-\mathbf{E} \times(\nabla \times \mathbf{E}) \right]d\mathbf{x} &= \sum_i \mathbf{e}_i \int_V \nabla\cdot\left[ E_i \mathbf{E} - \frac12 \mathbf{e}_i E^2 \right]d\mathbf{x} \\ & = \sum_i \mathbf{e}_i \oint_S\left[ E_i \mathbf{E} - \frac12 \mathbf{e}_i E^2 \right]\cdot d\mathbf{a}. \tag 1 \end{align} $$

En términos de la ley de la conservación de la estructura, estamos esencialmente de hecho, como hemos reducido la tasa de cambio de impulso para una superficie de plazo. Sin embargo, es que clama por una cierta simplificación. En particular, esta expresión es dependiente, pero está tan cerca de ser base independiente que vale la pena un vistazo más de cerca.

El primer término, por ejemplo, es simplemente clamando por una simplificación sería algo como $$ \sum_i \mathbf{e}_i \oint_S E_i \mathbf{E}\cdot d\mathbf{a} = \oint_S \mathbf{E}\, \mathbf{E}\cdot d\mathbf{a} $$ si tan sólo pudiéramos hacer sentido de un objeto como $\mathbf{E}\, \mathbf{E}$. Incluso mejor, si nos podría hacer sentido de dicha combinación, entonces resulta que el aparentemente base dependientes de la combinación de lo que vendría en el segundo término, $\sum_i \mathbf{e}_i\,\mathbf{e}_i$, resulta ser la base de independiente: se puede probar que para cualesquiera dos bases ortonormales $\{\mathbf{e}_1, \mathbf{e}_2, \mathbf{e}_3\}$$\{\mathbf{e}_1', \mathbf{e}_2', \mathbf{e}_3'\}$, las combinaciones son las mismas: $$ \sum_i \mathbf{e}_i\,\mathbf{e}_i = \sum_i \mathbf{e}_i'\,\mathbf{e}_i' $$ siempre y cuando el producto $\mathbf{u}\,\mathbf{v}$ de dos vectores, lo que termina siendo, es lineal en cada componente, que es sin duda una suposición razonable.

Entonces, ¿qué se debe este nuevo vector de la multiplicación? Una de las claves para darse cuenta de lo que realmente necesitamos es de notar el hecho de que todavía no hemos asignado ningún verdadero significado físico a la combinación de $\mathbf{E}\,\mathbf{E}$; por el contrario, que sólo interactúan con ella por que salpican "uno de los vectores del producto" con el área de la superficie del elemento $d\mathbf{a}$, y que deja un vector $\mathbf{E}\,\mathbf{E}\cdot d\mathbf{a}$ que podemos integrar para obtener un vector, y que no requiere de una nueva estructura.

Vamos, entonces, a escribir una lista de cómo queremos que este nuevo producto de comportarse. Para mantener las cosas en claro, vamos a darle un poco de fantasía en el nuevo símbolo como $\otimes$, principalmente para evitar inconvenientes, combinaciones, como $\mathbf{u}\,\mathbf{v}$. Queremos entonces,

  • una función de $\otimes:V\times V\to W$, lo que lleva a la euclídea vectores en $V=\mathbb R^3$ en algunas espacio vectorial $W$ en el que vamos a mantener nuestra fantasía nuevos objetos.
  • Las combinaciones de la forma $\mathbf{u}\otimes \mathbf{v}$ debe ser lineal en ambos $\mathbf{u}$$\mathbf{v}$.
  • Para todos los vectores $w$$V$, y todas las combinaciones $(\mathbf{u},\mathbf{v})\in V\times V$, queremos que la combinación de $(\mathbf{u}\otimes \mathbf{v})\cdot\mathbf{w}$ a ser un vector en $V$. Aún más, queremos que sea el vector $(\mathbf{v}\cdot\mathbf{w})\mathbf{u}\in V$.

Esto último se ve realmente muy fuerte, pero hay evidentemente espacio para la mejora. Por un lado, depende de la euclídea, que no es realmente necesario: se puede hacer una declaración equivalente que utiliza el espacio vectorial dual.

  • Para todos los $(\mathbf{u},\mathbf{v})\in V\times V$ y todos los $f\in V^\ast$, queremos $f_\to(\mathbf{u}\otimes \mathbf{v})=f(\mathbf{v})\mathbf{u}\in V$ a la espera, donde $f_\to$ simplemente significa que $f$ actúa sobre el factor de la derecha.

Por último, si estamos haciendo cosas con el dual, podemos reformular que en un poco más bonita. Puesto que dos vectores $\mathbf{u},\mathbf{v}\in V$ son iguales si y sólo si $f(\mathbf{u})=f(\mathbf{v})$ todos los $f\in V^\ast$, podemos dar otra declaración equivalente de la misma declaración:

  • Para todos los $(\mathbf{u},\mathbf{v})\in V\times V$ y todos los $f,g\in V^\ast$, queremos $g_\leftarrow f_\to(\mathbf{u}\otimes \mathbf{v})=g(\mathbf{u})f(\mathbf{v})\in V$.

[Nota, aquí, que esta última frase no es realmente de lujo. Esencialmente, es decir que el vector de la ecuación (1) es, en realidad, ser interpretado como un componente por componente de la igualdad, y eso no es realmente fuera de la marca de cómo hacemos las cosas.]

Podría seguir, pero es claro que este requisito puede ser reformulado en el universal de la propiedad del producto tensor, y que reformular la frase es un trabajo para los matemáticos. Por lo tanto, se puede ver la historia como ésta: Al golpear la ecuación (1), le damos a los matemáticos de esta lista de requisitos. De ir, creo que por un poco, y volver a contarnos que tal estructura no existe (es decir, existen rigurosos construcciones que cumplan con los requisitos) y que es esencialmente único, en el sentido de que varios de este tipo de construcciones son posibles, pero son canónicamente isomorfo. Para un físico, lo que significa es que está bien para escribir objetos como $\mathbf{u}\otimes \mathbf{v}$ mientras uno se mantenga dentro de las reglas del juego.

Tan lejos como el electromagnetismo va, esto significa que podemos escribir nuestra ley de la conservación en el formulario $$ \frac{ d\mathbf{P}_\rm{mech}}{dt} +\frac{d}{dt}\int_V\epsilon_0\mathbf{E}\times \mathbf{B}d\mathbf{x} = \oint_A \mathcal T\cdot d\mathbf{a} $$ donde $$ \mathcal T = \epsilon_0\left[ \mathbf{E}\otimes\mathbf{E}+c^2\mathbf{B}\otimes\mathbf{B} -\frac12\sum_i\mathbf{e}_i\otimes\mathbf{e}_i\left(E^2+c^2 B^2\right) \right] $$ es, por supuesto, las de Maxwell tensor de tensiones.

Yo podría ir y acerca de esto, pero creo que esto realmente captura la esencia de cómo y dónde ocurre en la física que una situación es realmente la mendicidad el uso de un producto tensor. Hay otras situaciones, por supuesto, pero esta es la más clara de todas las que conozco.

6voto

Nathan Feger Puntos 7675

Me gustaría añadir otra respuesta a ampliar Federico respuesta, porque la mecánica cuántica, no ofrecen otra muy limpio manera de llegar directamente a la universal de la propiedad de un producto tensor de limitaciones físicas. Esta característica universal es, como estado,

dado $k$ espacios vectoriales $V_1,\dots,V_k$ sobre el mismo campo de $\Bbb K$ queremos encontrar un nuevo espacio de $S$ y universal multilineal mapa de $T$ tal que para cada espacio vectorial $W$ y multilineal asignación de $g : V_1\times\cdots\times V_k\to W$ tenemos un lineal mapa de $f : S\to W$ tal que $g = f\circ T$.

Decir, entonces, que usted ha $n$ mecánica cuántica de los sistemas que usted sabe que son descritos por los espacios de Hilbert $\mathcal H_1,\ldots,\mathcal H_n$ de su propio, y se quiere dar una descripción coherente de todo el sistema compuesto, ya que están interactuando o no. Los postulados de la mecánica cuántica requieren que existe un espacio de Hilbert que describe todo el sistema: que es que es posible, en principio, para superponer dos determinados estados de la global del sistema. Vamos a llamar a este espacio de Hilbert $\mathcal H$.

El universal mapa, por supuesto, es simplemente "la formación de un estado compuesto": es simplemente el mapa $$T:\mathcal H_1\times\cdots\times\mathcal H_n\to\mathcal H$$ que me va a dar el estado del sistema global en $\mathcal H$ si le doy el estado de cada sistema en su espacio de Hilbert. Hasta el momento esa es toda la nomenclatura. Se requiere, sin embargo, que $T$ ser lineal en cada entrada, y que es donde la física vienen en. Decir que puedo preparar sistemas de 2 a $n$ usando teniendo en cuenta los preparativos, y que tengo dos estados distintos que puedo preparar el sistema 1 en. Cada uno de esos estados le dará un estado global en $\mathcal H$. Si yo ahora preparar una superposición en el sistema 1, yo también quiero que el sistema global, a estar en una superposición, porque puedo ver la preparación de los sistemas de 2 a $n$ como "anexos" a mi superposición procedimiento en el sistema 1, y sería incoherente tiene el resultado (la superposición) dependen de la presencia de otros sistemas.

Por último, vamos a ver lo que me puede salir, físicamente, de mi sistema compuesto. La física básica de predicción que puedo obtener de cualquiera de los sistemas, de forma individual, es el conjunto de elementos de la matriz de la forma $$\langle \phi|A|\psi\rangle,$$ donde estoy midiendo en el estado $\langle\phi|$ después de evolucionar durante algún tiempo y, posiblemente, multiplicando por algunos observables, que se encuentra codificada en algún operador $A$. Resultado de las probabilidades, por ejemplo, están codificados en el mod-plazas de tales lineal formas, a pesar de su fase también es recuperable uso adecuado de las mediciones.

Para nuestro sistema compuesto, por otro lado, tengo que dejar a todo el sistema evolucione y esto puede implicar interacciones. El final de la amplitud de la evolución de más de medición, por otro lado, debe ser lineal en cada sistema, porque si me preparo una superposición en un sistema y dejar a los demás solo las amplitudes debe ser lineal, como el apéndice, de preparación y medición de los otros subsistemas puede ser visto como parte del procedimiento de medición en cada sistema. Por lo tanto, con toda probabilidad, las amplitudes de las mediciones en todo el sistema debe ser multilineal de las funciones de $g$. Del mismo modo, por construcción, este conjunto de multilinears cubre todos los físicos de las amplitudes.

En términos de la composición espacio de Hilbert, a pesar de que, todo lo que he hecho es preparar el sistema en algún estado global $|\Psi\rangle$, dejarlo evolucionar durante un tiempo, y el proyecto sobre algún estado global $\langle \Phi|$, y la amplitud para que, $$\langle\Phi|A|\Psi\rangle,$$ es necesariamente una función lineal $f=\langle\Phi|A$ mundial en el espacio de Hilbert $\mathcal H$. Así pues, tenemos que todas las funciones multilineales $g$ en el componente de Hilbert espacios admite una descomposición de la clase $$g=f\circ T,$$ que simplemente afirma que todas las medidas de articulación de los subsistemas de una unidad de medida en el sistema global. Por ahora, por supuesto, hemos proporcionado todos los elementos para el universal de la propiedad del producto tensor, por lo que este corrige la estructura de $\mathcal H$ y proporciona un entorno en el que estos requisitos se presentan de forma natural.

5voto

Zero Stack Puntos 130

El auto que contiene la discusión en el ámbito de la mecánica cuántica, una buena explicación podría ser la siguiente:

El estado de un mecánico-cuántica del sistema es descrito por un rayo en un complejo (separable) espacio de hilbert $\mathcal{H}$. Con esto quiero decir que se fija un espacio de Hilbert $\mathcal{H}$ y uno del estado de su sistema corresponde a un punto en $\mathbb{C}\mathbb{P}(\mathcal{H})$.

Físicamente se suele decir que esto de la siguiente manera: dos vectores $|\psi_1\rangle$ $|\psi_2\rangle$ que se diferencian por un multiplicativo del número complejo i.e $|\psi_1\rangle =\alpha |\psi_2\rangle, \ \alpha \in \mathbb{C}$, siendo en el mismo rayo, descibe el mismo estado. Además, usted puede pedir para bien normalizado de los estados y haciendo de esta su $\alpha$ va a ser un puro fase.

Ahora, si usted tiene dos sistemas diferentes, cada uno con su espacio de hilbert $\mathcal{H}_1$$\mathcal{H}_2$, a menudo se desea construir el sistema compuesto. Quiero decir con esto que a usted le gusta tratar a los dos sistemas juntos como un gran uno.

Entonces usted debe encontrar un espacio de hilbert $\mathcal{H}_{1+2}$ para el total del sistema, y este tiene que ser construido con $\mathcal{H}_1$$\mathcal{H}_2$.

Se puede demostrar que ninguna de las $\mathcal{H}_1 \times \mathcal{H}_2$ ni $\mathcal{H}_1 \oplus \mathcal{H}_2$ trabajo por diferentes razones. Si no estoy mal, a veces (en infinitas dimensiones de los casos) el producto cartesiano de dos espacios de hilbert no es más hilbert. Mientras que para la suma directa, esto es, básicamente, de un par de estados de $\mathcal{H}_1$ $\mathcal{H}_2$ por separado y no son capaces de discutir las interacciones entre ellos.

Además, tanto el producto cartesiano y la suma directa de espacios vectoriales no contienen vectores $|w\rangle$ que no puede ser dividido en el producto cartesiano o la suma directa de $|v_1\rangle \in \mathcal{H}_1$$|v_2\rangle \in \mathcal{H}_2$. Físicamente esto es terrible, ya que los estados como $|w\rangle$ son entagled estados, los cuales son experimentalmente demostrado que existe.

Por lo tanto te llevan a considerar la posibilidad de $\mathcal{H}_1 \otimes \mathcal{H}_2$.

Por qué es necesario la construcción de los matemáticos hacen y no el de los físicos de hacer, creo que es una buena respuesta podría ser el hecho de que los físicos manera no prueba el hecho de que el producto tensor de dos vectores (aquí también hilbert) el espacio es único.

Esto es muy importante para mi opinión personal, ya que dado un sistema quiero asociarlo exaclty uno bien definido el espacio de hilbert.

Espero que esto fue útil, pero sí, como alguien sugirió anteriormente, es realmente difícil de contestar este tipo de preguntas en una buena manera.

3voto

MRA Puntos 546

Hay varios excelentes respuestas aquí. Yo propongo uno más simple -- en el corazón, un tensor es sólo lineal mapa de los tensores a los tensores. En particular, puede ser lineal en el mapa de un espacio vectorial a otro espacio vectorial. Obviamente, hay muchas circunstancias en las que sería necesario tomar un vector como entrada, y escupir otro vector como de salida. Si la función satisface ${\vec f}(c\,{\vec v} + d\,{\vec w}) = c\,{\vec f}({\vec v}) + d\,{\vec f}({\vec w})$, para todo c,d,v,w, a continuación, se puede representar a ${\vec f}({\vec v})$ como algunos tensor $f({\vec v})^{a} = T^{a}{}_{b}v^{b}$

0voto

aceinthehole Puntos 106

Otra respuesta en el contexto de la mecánica cuántica.

Quiero mostrar cómo el tensor de las propiedades del producto son, naturalmente, solicitó al tratar con la "composición de independiente sistems" mirando los observables que deben estar presentes en el compuesto sistem.

Más precisamente, se comienza con dos espacios de Hilbert $A$ $B$ describe dos sistemas, por lo que las características observables en vivo en $L(A)$ $L(B)$ (voy a considerar sólo el finito dimensionales caso, $L(A)$ denota el conjunto de operadores lineales en $A$) y la búsqueda en el espacio de $\mathcal{O}$ de los compuestos sistem observables guiado por un principio natural.

El principio físico que se sigue es el siguiente: fix $\rho$ $\sigma$ estados $A$$B$, entonces deben existe un estado correspondiente a $\rho \wedge \sigma$ tal que, para cada una de las $X$ $Y$ observables para el sistems $A$$B$, correspondiente observable $X \wedge Y$ existe para que $\langle X \wedge Y \rangle_{\rho \wedge \sigma} = \langle X \rangle_\rho \langle Y \rangle_\sigma$.

El derecho de los estados que define a una forma bilineal en $L(A) \times L(B)$ con valores en $\mathbb{R}$, mientras que la izquierda miembro debe corresponder a un lineal funcional en $\mathcal{O}$ (el valor de la media es una operación lineal en el observables).

Por lo tanto, la característica universal del producto tensor imponer que $\mathcal{O}$ = $L(A) \otimes L(B) = L(A \otimes B)$ y que $X \wedge Y = X \otimes Y$.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X