19 votos

* comprensión * covarianza vs contravarianza y elevar / bajar

Hay un montón de artículos, todo el lugar sobre la distinción entre los vectores covariantes y contravariante de vectores - después de luchar a través de muchos de ellos, creo que estoy empezando a hacerme a la idea. Me pregunto si algunos-uno/la gente me puede ayudar a entender el sentido / significado de la misma.

Mi fondo es la física, sin formación en 'álgebra abstracta' per se. El lenguaje que uso a continuación es básicamente como técnica, como yo lo entiendo (lo siento...).


A mi entender:
Contravariante de vectores (como el normal desplazamiento/velocidad/etc vectores---con la parte superior de índices: $\vec{v} = v^i \, \bf{e}_i$,$\vec{\bf{e}} = \bf{e}_i$) transforman como $v^{\,j}\prime = \frac{dx^{j}\prime}{dx^i} v^i$ .

Covariante vectores (como el gradiente de vectores---con menores índices: $\vec{w} = w_i \, \bf{e}^i $,$\vec{\bf{e}} = \bf{e}^i$) transforman como $w_{j}\prime = \frac{dx^i}{dx^{j}\prime} w_i$ .

También tenemos una métrica $g_{i,j}$ o $g^{i,j}$ que se puede transformar un vector contravariante a un vector covariante.


Preguntas:
Si estos vectores existen en el mismo espacio (espacio vectorial?), y queremos hacerlos interactuar---es decir, tomar el dot-producto entre ellos (que requiere ser superior índice y el otro de menor índice), entonces ¿por qué tienen que ser expresado con la diferencia de bases (basises?)?---no significa eso que están en diferentes marcos de referencia?

¿Cuál es el significado detrás de cambio de un vector a partir de covariante a contravariante? Los componentes de cambiar de alguna manera, pero el 'significado' de el vector se supone que debe estar el mismo, derecho?

Hace que algo sea un vector contravariante simplemente significa que se define con respecto a una base de vectores tangente; mientras que un vector covariante es una referencia a una base de vectores normales?
[esta es mi interpretación de la primera figura de http://en.wikipedia.org/wiki/Covariance_and_contravariance_of_vectors ]

31voto

Scott Wade Puntos 271

Lo que hace la típica explicación física de la geometría diferencial tan confuso, es que tiende a ser tan coordinar la base de que es difícil de comprender que la mayoría de los objetos que no dependen de un sistema de coordenadas. De matemáticas, estoy más acostumbrado a que se referirá a los vectores, no como contra - y vectores covariantes, pero como vectores de tangentes y diferenciales (o cotangente vectores).

Imaginemos que nuestro colector de la superficie de la Tierra. Tenemos un buen mapa de la misma en un atlas con longitudes a lo largo del eje x y latitudes a lo largo del eje. Vamos a utilizar las coordenadas $x^{\mu}$ donde $\mu\in\{\text{long},\text{lat}\}$, pero recuerde que estos sólo sirven para que nos diga donde en el mapa de una posición determinada en la Tierra.

Ahora, digamos que vamos a dar un paseo. Tenemos tiempo de nuestra caminata (en segundos) y en cualquier momento estamos en algún punto de $x(t)$ de la Tierra. Podemos describir estas coordenadas como $x^\mu(t)$, y en cualquier momento podemos dar a nuestros velocidad como $\dot x^\mu=dx^\mu/dt$; recuerde que el punto en la Tierra $x(t)$ existe independiente de la que coordina $x^\mu$.

Si utilizamos grados como la unidad para las latitudes y longitudes, la velocidad en unidades $\text{deg}/\text{sec}$. El vector $\dot x$ es una tangente vector que indica la velocidad y dirección independiente de que las coordenadas que estamos utilizando, y la manera natural a dibujar un vector tangente es como una flecha.

Si me paseo a lo largo de la línea del ecuador, el vector tangente es probable que sea un corto vector en el mapa. Sin embargo, si entro en el este, oeste, cerca de uno de los polos, ya que el mapa se estira hacia fuera (en relación a las distancias reales en la Tierra) podría producir un largo vector. I. e. cuando el mapa se estira, la tangente vectores estirarse junto con él. Así que si se extiende el mapa, la flecha que representa el vector tangente se estira con ella.

Ahora, supongamos que tenemos una función de $F$ que toma un valor en cualquier lugar en la Tierra. Podría ser la altitud a la superficie, la temperatura, etc.: digamos que se mide la temperatura en grados Kelvin. En cualquier punto, la función tiene un gradiente. Si queremos ilustrar $F$ en el mapa, es una manera de colorear el mapa de acuerdo a los valores de $F$, o dibujar los contornos de $F$ en el mapa, es decir, las curvas para que $F$ es constante. Si la estiramos o deformar el mapa, estos contornos todavía será correcta ya que se deforman con el mapa, por lo que no dependen de la coordinatesystem. El diferencial de $dF$ nos dice cómo de rápido se $F$ cambios en cualquier punto y en cualquier dirección y en unidades de $\text{K}/\text{deg}$. Si se extiende el mapa, las líneas de contorno obtener más alejados, por lo que el gradiente de aparecer con menos pendiente en el mapa. En las coordenadas, escribimos esto $dF=(dF/dx^\mu)dx^\mu$ donde $dx^\mu$ es sólo el gradiente de la coordenada. El punto es que la $dF$ es realmente independiente del sistema de coordenadas.

Si combinamos nuestro caminar con la función de $F$, obtenemos $F(x(t))$ como el valor a lo largo de nuestro camino. El cambio en el tiempo se convierte en$(d/dt)F(x(t))$, con lo cual podemos escribir como $$\frac{d}{dt}F(x(t))=\frac{dF}{dx^\mu}\dot x^\mu=dF\cdot\dot x\tag{1}$$ y es independiente del sistema de coordenadas. El $dF$ $\dot x$ son el diferencial de $F$ y el vector tangente de $x$, ambos de los cuales son independientes de las coordenadas que decidamos usar. Las unidades también están informativo: $\dot x$ unidades $\text{deg}/\text{sec}$, mientras que $dF$ unidades $\text{K}/\text{deg}$.

A partir de (1), vemos que hay una forma natural de llevar el producto de un vector tangente con un diferencial. De hecho, los diferenciales (en cualquier momento) forman la doble espacio vectorial del espacio vectorial de los vectores de tangentes, que es la razón por la que son llamados también cotangente vectores.

Todo esto se hace enteramente sin la necesidad de una métrica.

La métrica sólo entra en juego cuando, por ejemplo, quiere convertir los vectores de tangentes en una medida real de las distancias físicas. Si desea calcular la longitud de un camino, necesita una métrica. Del mismo modo, es necesario cuando se calcula la velocidad en términos absolutos como en la energía cinética $E_{\text{kin}}=\frac{m}{2}g_{\mu\nu}\dot x^\mu\dot x^\nu$. Otro lugar es en el campo de la ecuación de onda que, por ejemplo, $g^{\mu\nu}(d\phi/dx^\mu)(d\phi/dx^\nu)$ puede entrar.

Conexiones, que son objeto matemático que indican cómo paralelo de transporte de vectores a lo largo de una ruta de un punto a otro, puede ser definido sin una métrica. Sin embargo, si hay una métrica, hay una conexión en particular, la de Levi-Civita de conexión, lo que naturalmente corresponde a la métrica (lo cual es natural, ya que se necesita la métrica para especificar lo que se supone por la distancia más corta ruta de acceso), y cuando se especifique la de Levi-Civita de conexión (que en un sistema de coordenadas que se hace con los símbolos de Christoffel) se encontrará con elevación/descenso de los índices.

Mientras que la métrica no inducir una forma natural para identificar la tangente y la cotangente espacios vectoriales, que es la identificación que se aplica al subir o bajar los índices, esta identificación es la métrica dependiente y, por tanto, sólo se requiere cuando se computing algo que depende de la métrica.

Mi recommentation sería no tratar de atribuir significado, al menos no demasiado, para que esta identificación de la tangente y la cotangente espacios vectoriales. En su lugar, se podría pensar en por qué estos introducir la imagen en física de todos y entender esos casos.

7voto

MyPreciousss Puntos 357

Diferentes magnitudes físicas tienen diferentes reglas de transformación: sólo para dar un ejemplo:

  • la posición $q^i$ transforma contravariantly
  • momentum $p_i$ transforma covariantly

Por qué? En la mecánica clásica el Lagrangiano se define como una función de $q^i$ y sus derivados. Por otro lado, la generalización de impulso está dado como:

$$ p_i=\frac{\partial L}{\partial \dot{q^i}} $$

Si cambiamos de $q$ $\bar{q}$la transformación de la ley será inverso para las coordenadas versículo impulso debido a la regla de la cadena. Este es sólo un ejemplo. Lo elegimos marco de la física en términos de es en cierto sentido una elección. Porque podemos convertir covariante a contravariante de objetos con la métrica hay muchas maneras de marco de un determinado conjunto de leyes físicas.

Volviendo a su pregunta sobre el cambio de los marcos de referencia de cambio de covariante a contravariante, este no es el caso. La métrica de la transformación no es un cambio de coordenadas, es algo muy diferente. Es una manera de cambiar la notación, o más, matemáticamente hablando, es la implementación de un isomorfismo.

Más importante que la elección de la notación (escrito tensores contravariante o covariantly) es la construcción de la acción o de lagrange. Debe satisfacer ciertas simetrías, dependiendo de qué tipo de física que considere:

$$ L = \frac{m}{2} \vec{v} \cdot \vec{v} = \frac{m}{2} v_iv^i $$

El punto-el producto es invariante bajo rotaciones, este Lagrangiano es invariante bajo rotaciones como debería, ya que los modelos de una partícula libre en el espacio euclidiano.

$$ L = kF_{\mu \nu}F^{\mu \nu} $$

donde $F_{\mu \nu}$ es el tensor de Faraday que transforma covariantly mientras que $F^{\mu \nu}$ es el contravariante versión. Juntos forman un escalar con respecto a la transformación de Lorentz (estoy evitando la discusión completa acerca de Poincaré transformaciones aquí).

La cuestión de la física es parte de esto: ¿cómo se puede construir escalares dada la simetría de su teoría? En última instancia, esto lleva a que el estudio de la teoría de la representación, spinors etc... no es un cuento y la pregunta que te están pidiendo es, sin duda vale la pena preguntar.

En la coordenada de un lenguaje libre de la covarianza de los componentes es equilibrada por la contravarianza de la base o viceversa. Nota como un ejemplo: $$ \bar{A}_{\mu'} = \Lambda^{\nu}_{\mu'}A_{\nu} \qquad \text{whereas} \qquad d\bar{x}^{\mu'} = \frac{\partial \bar{x}^{\mu'}}{\partial x^{\nu}}dx^{\nu} $$ donde $\bar{x}^{\nu'} = \Lambda^{\nu'}_{\mu} x^{\mu}$. Diferenciar a ver $\Lambda^{\mu}_{\nu'} = \frac{\partial x^{\mu}}{\partial \bar{x}^{\nu'}}$ por espacio de Minkowski donde me estoy planteando un cambio de coordenadas es constante en todos los puntos en el espacio-tiempo; una transformación de Lorentz. Poner juntos, ya $\frac{\partial \bar{x}^{\nu'}}{\partial x^{\mu}}$ es inversa a la $\frac{\partial x^{\mu}}{\partial \bar{x}^{\nu'}}$ por la regla de la cadena: esto significa que:

$$ \frac{\partial \bar{x}^{\nu'}}{\partial x^{\mu}}\frac{\partial x^{\mu}}{\partial \bar{x}^{\alpha'}} = \delta_{\alpha'}^{\nu'} $$

que podríamos escribir en la $\Lambda$ notación como $\Lambda^{\nu'}_{\mu}\Lambda^{\mu}_{\alpha'}=\delta_{\alpha'}^{\nu'} $. La forma $A$ puede ser escrito en la vedados o tienen llave ni rejas en las coordenadas.

$$ A = \bar{A}_{\mu'}d\bar{x}^{\mu'} = A_{\nu}dx^{\nu} $$

La afirmación de que estos son, de hecho, igual es apoyado por la transformación de las leyes que me dio anteriormente para las componentes covariantes de $A$ y el contravariante de la transformación de las formas de la base $dx^{\mu}$.

Las matemáticas me voy a esbozar aquí es principalmente de álgebra lineal y el concepto de base. La transformación de la ley para la base es la inversa de la de los componentes. El objeto fundamental considerado, sea un vector, la forma, el tensor etc... es invariante bajo la coordenada de cambio. Es nuestra imagen de lo que cambia. Que es lo que yo pienso acerca de ello.

6voto

Matt Dawdy Puntos 5479

La versión corta es que los índices de decir cómo las cosas se comportan bajo el cambio arbitrario de coordenadas. (La versión larga realmente requiere de un cierto nivel de comodidad con el álgebra abstracta apreciar.) Cuando se utiliza la métrica para transformar contravariante cosas a covariante de las cosas, de la operación que se está realizando no conmuta con el cambio arbitrario de coordenadas; sólo conmuta con los cambios de coordenadas que también preserva la métrica. Así, mientras que sólo el trabajo con mapas que preservar la métrica, no hay nada malo en hacer esto, pero en el momento de permitir que los mapas que no preservar la métrica, usted tiene que tener cuidado de qué tipo de identificaciones estás haciendo.

Covariante y contravariante tensores viven en diferentes espacios, pero las cosas no tienen que vivir en el mismo espacio para interactuar. Tenemos la libertad para hablar de las operaciones de $f : X \times Y \to Z$ que toman entradas de dos tipos diferentes y devuelve una entrada de potencialmente otro tipo, y tensor de la contracción es una operación de este formulario.

No estoy seguro de lo que quieres decir con el "significado" detrás de cambio de un vector a partir de covariante a contravariante.

2voto

Nikos M. Puntos 1031

me gustaría añadir otra opinión sobre esta cuestión (complemetary a la ya de niza respuestas)

Ambos co-variante y contra-variante de vectores son sólo los vectores (o más en general 1-el fin de los tensores).

Además son vectores que se relacionan con el mismo subyacente espacio (por ejemplo el espacio euclidiano o, en general, un colector)

Además se relacionan con el mismo espacio pero en diferente pero de doble maneras (como tales tienen diferentes, pero el doble, el de las leyes de transformación, como ya se ha dicho)

Co-variante de vectores son parte de lo que se llama el espacio de la tangente, que para un espacio euclidiano coincide o es isomorfo al espacio en sí mismo. Y de contra-variante de vectores son parte de la doble espacio de la tangente, llamado co-el espacio de la tangente (como ya se ha señalado en otras respuestas) y que para un espacio euclidiano también coincide o también es isomorfo al espacio en sí mismo.

Estos espacios (y sus vectores) se doble, en el sentido algebraico, relacionados a través de la norma (producto interior) del espacio. Además son isomorfos a cada uno de los otros sin importar si son isomorfos a la base del colector de sí mismo (lo que se llama el subir y bajar índices)

Una pregunta es lo que estos (asociado) espacios representan, cómo se relacionan y qué es la intuición detrás de su uso?

Historicaly tensores y análisis tensorial se inició como un producto de la teoría de invariantes. Un camino que se necesitaba para expresar cantidades invariantes bajo un cambio de representación (o de cambio de base subyacente). Así, los tensores se utilizaron. tensores representan cantidades que se transforman en virtud de un cambio de representación en maneras que diversas cantidades expresadas en términos de invariantes.

Nota, en la terminología de la asociación con la co-variant/contra-variante de índices es en gran parte un convenio, consistente convención va a hacer.

Esto también le da la (intuitiva) relación entre los co-variante de los tensores (vectores) y de contra-variante de los tensores (vectores). Cuando un co-variante vector (componentes) transformar en una forma, por ejemplo por un factor de escala $s$. El (asociado) contra-variante vector (componentes) se tiene que transformar por el inverso del factor de escala $1/s$ a fin de invariantes de las cantidades (por ejemplo, un producto interior $a^ib_i$) se mantienen invariables.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X