12 votos

¿Incompatibilidad con derivadas parciales como vectores de la base?

He estado tratando de convencer a mí mismo de que es compatible para reemplazar a base de vectores $\hat{e}_\mu$ con derivadas parciales $\partial_\mu$. Después de pensar un poco, llegué a la conclusión de que la base de vectores $\hat{e}_\mu$ fueron en última instancia, sólo los símbolos que representan lo que nosotros pensamos como flechas, por lo que no es un problema para el uso de un símbolo diferente. El único requisito es que se puede manipular la $\partial_\mu$ en la misma manera como el $\hat{e}_\mu$.

Sin embargo, elevación/descenso de los índices parece crear una incoherencia. En la conmutación de nuestra representación de los vectores de la base, hacemos las sustituciones:

$$\hat{e}_\mu \rightarrow \partial_\mu$$

$$\hat{e}^\mu \rightarrow dx^\mu$$

Sin embargo, mientras que anteriormente podría escribir $\hat{e}^\mu=g^{\mu \nu}\hat{e}_\nu$, no somos capaces de ser capaz de escribir la misma relación en la nueva representación:

$$dx^\mu \neq \partial^\mu =g^{\mu \nu} \partial_{\nu}$$

Mis preguntas son:

  • He hecho algo no válido aquí?
  • Si no, es simplemente una regla no escrita de que uno nunca debe tratar de levantar un índice de una base de vectores?
  • ¿Cuál es la motivación para escribir vectores de la base como en derivadas parciales o diferenciales (por la tangente o cotangente del espacio) como opuesto a la escritura de algún otro símbolo? ¿Necesitamos las propiedades de un derivado o diferencial en nuestra base de vectores? Soy consciente de que el $\partial_\mu$ parecerse a la expresión $\frac{\partial\vec{r}}{dx^\mu}$ que es una elección natural para los vectores de la base $\hat{e}_\mu$, pero las diferencias parecen salir de la nada.

14voto

sid Puntos 41

Elevar y bajar los índices en un vector no es una operación válida. Vectores de la base no son la excepción. Mientras que $x_\mu=g_{\mu\nu}x^\nu$ es una operación válida, $\hat e^\mu=g^{\mu\nu}\hat e_\nu$ no lo es. La razón es que en el primer caso se trata de lidiar con las componentes de un vector, y en el segundo caso, usted está tratando con un vector propio.

Permítanme elaborar. Dado un vector $\hat X$ $$ \hat X=x^\mu\hat e_\mu $$ usted puede reducir el índice de $\mu$ $x^\mu$ a través de $$ x_\mu\equiv g_{\mu\nu}x^\nu $$

Que es: levantar y bajar los índices es una operación que se define para las componentes de un vector (o covector).

El índice de $\mu$ $\hat e_\mu$ no es un vector de índices; sólo las etiquetas de los diferentes vectores de la base. Usted no puede aumentar/disminuir este índice, debido a que $\hat e_\mu$ no denota los componentes de cualquier vector. La operación $$ \phantom{\color{red}{\text{N!}}}\qquad\hat e^\mu\equiv g^{\mu\nu}\hat e_\nu\qquad\color{red}{\text{N!}} $$ es un sin sentido de la operación.

Lo mismo puede decirse acerca de covectors. Dado un covector $\tilde X$ $$ \tilde X=x\mu\tilde e^\mu $$ usted puede elevar el índice en $x_\mu$. Pero no se puede reducir el índice en $\tilde e^\mu$, debido a que el índice de no indicar los componentes de un covector; sólo las etiquetas de las diferentes bases covectors.

Lo que es más importante, mientras que $\hat e_\mu$ es una base del espacio de vectores, y $\tilde e^\mu$ es una base para el espacio de covectors, estos objetos no relacionados a través de la $$ \phantom{\color{red}{\text{N!}}}\qquad\hat e^\mu= g^{\mu\nu}\tilde e_\nu\qquad\color{red}{\text{N!}} $$ o cualquier otra relación.

En breve: se puede aumentar/disminuir los índices de cuando los índices indican los componentes de un objeto - ya sea un vector o un covector - pero no se puede aumentar/disminuir los índices de las bases de vectores/covectors, debido a que los índices no denotan los componentes de nada. Ellos son sólo etiquetas.

Sin embargo, ver el Musical de isomorfismo.

Espero que en este punto, usted todavía está conmigo. Dado un vector arbitrario $\hat v$ (como $\hat X$ o $\hat e_\mu$), y una función determinada $f$, podemos definir la acción de $\hat v$ $f$ como sigue: se define $$ \hat e_\mu[f]\equiv \frac{\partial f}{\partial x^\mu}\in\mathbb R $$ y extendemos esto a través de la linealidad: si $\hat v=v^\mu \hat e_\mu$, luego $$ \hat v[f]=v^\mu\frac{\partial f}{\partial x^\mu}\in\mathbb R $$

No voy a discutir por qué esta nueva operación es útil. Pero permítanme destacar que esta operación es algo nuevo, algo que nunca han visto antes: ahora los vectores pueden actuar en funciones! En cualquier caso, útil o no, esta nueva operación nos motiva a considerar la siguiente notación conveniente: vamos a escribir $\hat \partial_\mu$ en lugar de $\hat e_\mu$: $$ \hat \partial_\mu\equiv \hat e_\mu $$

Con esto, la ecuación de antes de ahora se convierte en $$ \hat\partial_\mu[f]=\frac{\partial f}{\partial x^\mu} $$

Tenga en cuenta que estamos usando el mismo símbolo, $\partial$, con dos significados diferentes: por un lado, denota una base de vectores, y por otro lado, denota una derivada parcial. La cosa habitual que hacemos es colocar la distinción: acabamos de escribir $\partial_\mu$ para ambos, y dejar contexto de decidir lo que el símbolo significa.

En la misma vena, normalmente se utiliza el símbolo $\mathrm dx^\mu\equiv\tilde e^\mu$. Es decir, se denota la base de covectors por el símbolo $\mathrm dx^\mu$. Es sólo la notación.

Pasemos ahora a la gradiente. Definimos el covector $\mathrm d f$ como el covector que ha $\frac{\partial f}{\partial x^\mu}$ componentes: $$ \mathrm d f=\frac{\partial f}{\partial x^\mu}\tilde e^\mu $$ o, usando nuestra nueva notación, $$ \mathrm d f=\partial_\mu f\,\mathrm dx^\mu $$

Usted puede subir y bajar el $\mu$ índice en $\frac{\partial f}{\partial x^\mu}$, debido a que este índice indica que los componentes de un covector. En este sentido, se puede decir que se puede aumentar/disminuir el $\mu$ índice en $\partial_\mu$, siempre que este símbolo denota un derivado. Pero no se puede subir/bajar el $\mu$ índice en $\hat \partial_\mu$, siempre que este símbolo denota una base de vectores (por la misma razón que usted no puede subir/bajar el $\mu$ índice en $\hat e_\mu$).

En resumen: los objetos $\partial_\mu$ $\mathrm dx^\mu$ sustituir a la antigua notación $\hat e_\mu$$\tilde e^\mu$, pero que denotan el mismo objeto: son una base para el espacio de vectores y covectors. Esto significa que no puede subir/bajar sus índices. Por otro lado, el objeto de $\partial_\mu f$ indica que los componentes de la covector $\mathrm df$, y como tal, puede aumentar/disminuir su índice.

4voto

user149018 Puntos 71

Para entender lo que sucede cuando podemos subir o bajar los índices, tenemos que ver lo que en realidad son los objetos que están en funcionamiento.

TL;DR - Se plantean (inferior) componentes de los vectores (vectores duales), no su base.

Para ver por qué los derivados se utilizan como base, se utiliza la siguiente motivación: Imaginar una curva en algún lugar de $\mathbf{R}^3$. La curva tendrá un vector tangente en cada uno de sus puntos. Si denotamos la curva de $r(\lambda)$ (una función) con $\lambda$ el parámetro de curva, el vector tangente se $$\mathbf{t} = \frac{d\mathbf{r}(\lambda)}{d\lambda} = \sum\frac{dx^i}{d\lambda}\hat{x}^i$$ Así que ahora sabemos que la "tasa y la dirección del cambio" de la curva, en un punto de $r(\lambda)$. Hemos ganado un vector, y nos gustaría utilizar este vector para describir otras cosas que están pasando más que el colector.

La siguiente pregunta que nos hacemos es ¿cuál es la tasa de cambio de algún otro objeto en la dirección del primer vector. Bien, todavía estamos en el $\mathbf{R}^3$, así que sabemos cómo encontrar esas "tasas de cambio" - el operador nabla $\nabla = \frac{\partial}{\partial x} \hat{x} + \frac{\partial}{\partial y} \hat{y} + \frac{\partial}{\partial z} \hat{z}$. Para encontrar la tasa de cambio en la dirección de la previamente adquirida vector, se proyecto la $\nabla$ $\mathbf{t}$

$$\mathbf{t}\nabla = \sum \frac{dx^i}{d\lambda}\frac{\partial}{\partial x^i}$$ Aquí podemos ver que mediante el uso de vectores tangente, podemos sonda y obtener información acerca de las tasas de cambio de los objetos en ciertas direcciones.

Ahora, si hacemos uso de esta motivación, que los vectores que, al actuar sobre algunos objetos, nos dan información acerca de algunos de tasa de cambio, se puede construir una base de vectores tangente $\mathbf{R}^3$ $\{ \frac{\partial}{\partial x} , \frac{\partial}{\partial y}, \frac{\partial}{\partial z} \}$

Podemos demostrar que la base puede ser construida a lo largo de cada punto de un colector general, short-handed escrito $\{\partial_\mu\equiv\frac{\partial}{\partial x^\mu}\}$.

Vectores fueron construidos como objetos actuando en funciones, y también hay objetos que actúan sobre vectores y enviarlos a los números reales, llamados vectores duales. De nuevo, por el dibujo de la motivación de $\mathbf{R}^3$, se puede construir una base para estos dos vectores, y se denota esta base como $\{ dx^\mu\}$, en base a esto se define por la forma en que actúa sobre el vector de la base: $$dx^\mu(\partial_\nu) = \delta^\mu_\nu$$

Ahora viene uno de los puntos clave donde el error ocurrió - hemos definido una base de vectores, y un vector es un objeto como $u = u^\mu\partial_\mu$. Por ejemplo, podemos construir un vector $v=1\cdot\partial_1$. Por lo tanto, aquí el número 1 es un vector de componentes, mientras que $\partial_1$ es el componente de la base. Como un ejemplo, un vector dual debería ser escrita como $\omega = \omega_\nu dx^\nu$.

Vectores y vectores duales tienen una relación especial, un vector dual $\omega$ actúa sobre un vector $v$ y la envía a un número real. Podemos expresar esta el uso de sus bases. $$\omega(v) = \omega_\mu dx^\mu v^\nu\partial_\nu=\omega_\mu v^\nu dx^\mu\partial_\nu = \omega_\mu v^\nu\delta^\mu_\nu = \omega_\mu v^\mu$$

Ahora llegamos a la métrica del tensor. Un tensor es un objeto que actúa en un cierto número de vectores y vectores duales, en función del tensor de tipo. Un tensor métrico es un tensor que actúa sobre dos vectores.

Podemos escribir el tensor métrico utilizando previamente definido bases como: $$g = g_{\mu\nu}dx^\mu \otimes dx^\nu$$ Por lo tanto la acción de un tensor métrico, es decir, se necesitan dos vectores como una entrada y salidas de un número real. Escrito completamente en la base, esto es: $$g(u, v) = g_{\mu\nu}dx^\mu(u^\alpha \partial_\alpha) \otimes dx^\nu (v^\beta \partial_\beta)$$ $$g(u, v) = g_{\mu\nu}u^\alpha v^\beta dx^\mu (\partial_\alpha) dx^\nu(\partial_\beta)$$ $$g(u, v) = g_{\mu\nu}u^\alpha v^\beta \delta^\mu_\alpha \delta^\nu_\beta = g_{\mu\nu}u^\mu v^\nu$$

Esta operación tiene una notación corta $$g_{\mu\nu}u^\mu v^\nu = u_\nu v^\nu$$ y sólo aquí es donde el bajar y subir sucede. Esto también puede ser formalmente bien definido diciendo que la métrica induce un isomorfismo natural entre los vectores y vectores duales.

Así que, cuando usted baja de los índices, debe actuar sólo sobre las componentes de los vectores, no sobre la base, del mismo modo, al elevar los índices debe actuar sólo sobre las componentes de los vectores duales, no su base.

Una buena referencia, recomiendo "Una introducción a los colectores" por Loring W. Tu

3voto

Niels Bosma Puntos 200

Yo creo que tu fuente de confusión es combinar el uso de la enumeración de los índices para los vectores de la base, y el uso de vector de índices para las componentes de un vector. Estos dos tipos de índices deben ser tratados de manera diferente. Primero voy a decir lo que quiero decir por los dos tipos de índices, a continuación, voy a decir cómo deben ser tratados de manera diferente.

El primer tipo de índice es una enumeración índice de la base. Así que vamos a suponer que tenemos $n$ dimensiones de espacio vectorial, y permite elegir una base. Los vectores de la base puede ser escrito como $$\hat{e}_\mu,\quad \mu = 1,2,3,\cdots,n.$$ En este caso, el índice de $\mu$ es una enumeración de índice sólo se utilizan para la lista de los vectores de la base.

Ahora un vector $v$ puede ser escrito utilizando las coordenadas con respecto a esta base. En este caso se escribiría $v=v^\mu \hat{e}_\mu$. En este caso, el $\mu$ $v^\mu$ es un vector de índices. La diferencia es que para cada valor de $\mu$, $v^\mu$ es sólo un número donde $\hat{e}_\mu$ había sido un vector. Además, si el cambio de bases para la nueva base $\hat{\tilde{e}}_\mu$, relativa a la original base $\hat{e}_\mu$ por $$\hat{\tilde{e}}_\nu = R_\nu{}^\mu \hat{e}_\mu, $$ a continuación, las coordenadas $\tilde{v}^\nu$ $v$ con respecto a la nueva base $\hat{\tilde{e}}_\nu$ están relacionadas con las coordenadas antiguas $v^\mu$ con respecto a la vieja base $\hat{e}_\mu$ por $$\tilde{v}^\nu = R^{-1}{}^\nu{}_\mu v^\mu.$$

Creo que por ahora me han explicado cómo estos dos tipos de índices deben ser tratados de manera diferente. Uno enumera un conjunto de vectores, el otro enumera un conjunto de bienes número de coordenadas que se transforman bajo transformaciones de coordenadas.

Ahora vamos a suponer que tenemos un producto interior con coordenadas $g_{\mu\nu}$. A continuación, para cualquier base $\hat{e}_\mu$, se puede obtener una base dual $\hat{e}^\mu$ para el covector espacio, la satisfacción de $$\hat{e}^\mu(\hat{e}_\nu) = \delta^\mu{}_\nu.$$

Ahora dado cualquier vector $v$, se puede asociar con un vector dual $v'$, donde este vector dual $v'$ actúa sobre vectores $w$ tomando el interior del producto, con lo $\langle v, w \rangle$. Para obtener las coordenadas de esta doble producto $v'$, podemos escribir en la forma $v' = v'_\mu \hat{e}^\mu$. Nos encontramos con que $$ v^\mu g_{\mu \nu} = \langle v, \hat{e}_\nu \rangle = \langle v'_\mu \hat{e}^\mu, \hat{e}_\nu \rangle = v'_\mu\langle \hat{e}^\mu, \hat{e}_\nu \rangle = v'_\mu\delta^\mu{}_\nu = v'_\nu. $$ Por lo tanto, nos encontramos con que si $v^\mu$ están las coordenadas de un vector con respecto a alguna base, luego las coordenadas $v'_\mu$ el vector dual $v'$ con respecto a la base dual está dado por $v'_\nu = v^\mu g_{\mu \nu}$. En este sentido, puede utilizar la métrica para elevar los índices de coordenadas. Esto es posible porque cada coordenada es un número real, y cuando se toma de las combinaciones lineales de los números reales, se obtiene otro número real.

Por otro lado, no se puede decir $\hat{e}_\nu = \hat{e}^\mu g_{\mu \nu}$, debido a que el lado derecho es un vector, y el lado izquierdo es una combinación lineal de covectors, que le da otro covector, pero covectors y de los vectores de diferentes tipos de objetos, por lo que no puede ser igual.

Creo que esto debe responder a las dos primeras preguntas. Realmente no sé la respuesta a la tercera pregunta, a parte de decir que la forma más sencilla de definir el espacio de la tangente es en términos de las derivadas de los operadores y de las derivadas parciales con respecto a las coordenadas hacer una base natural.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X