14 votos

¿Qué significa transformarse como escalar o vector?

Estoy trabajando en un texto introductorio de electrodinámica (Griffiths), y me he encontrado con un par de preguntas que me piden que lo demuestre:

  1. la divergencia se transforma como un escalar bajo rotaciones
  2. el gradiente se transforma como un vector bajo rotaciones

Puedo ver cómo mostrar estas cosas matemáticamente, pero me gustaría ganar algo de intuición sobre lo que significa "transformarse como" vector o escalar. He encontrado definiciones, pero ninguna usando la notación consistente con el libro de Griffiths, así que esperaba alguna confirmación.

Mi conjetura es que "se transforma como un escalar" se aplica a un campo escalar, por ejemplo. $T(y,z)$ (trabajando en dos dimensiones ya que las preguntas del libro se limitan a dos dimensiones). Dice que si reetiquetas todas las coordenadas en el sistema de coordenadas usando: $$ \begin {pmatrix} \bar {y} \\ \bar {z} \end {pmatrix} = \begin {pmatrix} \cos\phi & \sin\phi \\ - \sin\phi & \cos\phi\end {pmatrix} \begin {pmatrix}y \\ z \end {pmatrix}$$ así que $( \bar {y}, \bar {z})$ da las coordenadas re-etiquetadas para el punto $(y,z)$ entonces: $$ \bar {T}( \bar {y}, \bar {z}) = T(y,z)$$ para todo y, z en el sistema de coordenadas, donde $ \bar {T}$ es el campo escalar rotatorio. Entonces pensé que tal vez estoy tratando de mostrar algo como esto $$ \overline {( \nabla \cdot T)}( \bar {y}, \bar {z})=( \nabla \cdot T)(y,z) $$ donde $ \overline {( \nabla \cdot T)}$ es el gradiente de rotación de $T$ .

La anotación de arriba me parece extraña, así que me pregunto si es correcta. También tengo curiosidad por saber cómo sería la formalización análoga de "se transforma como un campo vectorial".

0 votos

El libro de quantum de Shankar lo explica muy bien.

0 votos

@DanielSank ¿En qué página/capítulo/párrafo habla Shankar de esto?

0 votos

@MusséRedi no lo recuerdo, pero creo que está relativamente cerca del principio.

17voto

joshphysics Puntos 34367

Hay varias formas de formalizar matemáticamente las nociones de "transformar como un vector" o "transformar como un escalar" dependiendo del contexto, pero en el contexto que estás considerando, yo recomendaría lo siguiente:

Considere un número finito de tipos de objetos $o_1, \dots, o_n$ cada uno de los cuales vive en algún conjunto $O_i$ de objetos, y cada uno de los cuales está definido para transformarse de una manera particular bajo las rotaciones. En otras palabras, dada cualquier rotación $R$ y para cada objeto $o_i$ tenemos un mapeo cuando actuamos sobre objetos en $O_i$ nos dice lo que les sucede bajo una rotación $R$ : \begin{align} o_i \mapsto o_i^R = \text{something we specify} \end{align} Por ejemplo, si $o_1$ es sólo un vector $\mathbf r$ en un espacio euclidiano tridimensional $\mathbb R^3$ Entonces, lo normal es que se tome \begin{align} \mathbf r \mapsto \mathbf r^R = R\mathbf r. \end{align} Cada mapeo $o_i\mapsto o_i^R$ es lo que un matemático llamaría un acción de grupo del grupo de rotaciones sobre el conjunto $O_i$ (hay más detalles en la definición de una acción de grupo que ignoramos aquí). Una vez que hayamos especificado cómo estos diferentes objetos $o_i$ transforman bajo rotaciones, podemos hacer la siguiente definición:

Definición. Escalar bajo rotaciones

Que cualquier función $f:O_1\times O_2\times\cdots \times O_n\to \mathbb R$ se da, decimos que es un escalar en las rotaciones previstas \begin{align} f(o_1^R, \dots o_n^R) = f(o_1, \dots o_n). \end{align} Esta definición dice intuitivamente que si se "construye" un objeto $f$ de un montón de otros objetos $o_i$ cuya transformación bajo rotaciones ya has especificado, entonces el nuevo objeto $f$ que has construido se considera un escalar si no cambia cuando aplicas una rotación a todos los objetos que lo componen.

Ejemplo. El producto punto

Dejemos que $n=2$ y que $o_1 = \mathbf r_1$ y $o_2 = \mathbf r_2$ ambos sean vectores en $\mathbb R^3$ . Definimos $f$ de la siguiente manera: \begin{align} f(\mathbf r_1, \mathbf r_2) = \mathbf r_1\cdot \mathbf r_2. \end{align} Es $f$ ¿un escalar bajo rotaciones? Bueno, veamos: \begin{align} f(\mathbf r_1^R, \mathbf r_2^R) = (R\mathbf r_1)\cdot (R\mathbf r_2) = \mathbf r_1\cdot (R^TR\mathbf r_2) = \mathbf r_1\cdot \mathbf r_2 = f(\mathbf r_1, \mathbf r_2) \end{align} ¡así que sí es!

Ahora bien, ¿qué hay de un campo de escalares? ¿Cómo definimos esa bestia? Pues sólo tenemos que modificar ligeramente la definición anterior.

Definición. Campo de escalares

Que cualquier función $f:O_1\times\cdots \times O_n\times\mathbb R^3\to \mathbb R$ se le dará. Llamamos $f$ a campo de escalares en las rotaciones previstas \begin{align} f(o_1^R, \dots, o_n^R)(R\mathbf x) = f(\mathbf x). \end{align} Se puede pensar que esto es simplemente decir que la versión rotada de $f$ evaluado en el punto girado $R\mathbf x$ coincide con la versión no rotada de $f$ evaluado en el punto no rotado. Observa que esto es formalmente lo mismo que la ecuación que has escrito, es decir $\bar T(\bar x, \bar y) = T(x,y)$ .

Ejemplo. Divergencia de un campo vectorial

Considere el caso de que $\mathbf v$ es un campo vectorial. Las rotaciones se definen convencionalmente para actuar sobre los campos vectoriales de la siguiente manera (voy a tratar de encontrar otro post en physics.SE que explica por qué): \begin{align} \mathbf v^R(\mathbf x) = R\mathbf v(R^{-1}\mathbf x) \end{align} ¿Es su divergencia un campo escalar? Bien, para entrar en contacto con la definición que damos más arriba, dejemos que $f$ denotan la divergencia, es decir \begin{align} f(\mathbf v)(\mathbf x) = (\nabla\cdot \mathbf v)(\mathbf x) \end{align} Ahora observa que utilizando la regla de la cadena obtenemos (utilizamos la notación de suma de Einstein) \begin{align} (\nabla\cdot\mathbf v^R)(\mathbf x) &= \nabla\cdot\big(R\mathbf v(R^{-1}\mathbf x)\big)\\ &= \partial_i(R_{ij}v_j(R^{-1}\mathbf x) \\ &= R_{ij} \partial_i(v_j(R^{-1}\mathbf x)) \\ &= R_{ij}(R^{-1})_{ki}(\partial_k v_j)(R^{-1}\mathbf x)\\ &= (\nabla\cdot \mathbf v)(R^{-1}\mathbf x) \end{align} lo que implica que \begin{align} (\nabla\cdot\mathbf v^R)(R\mathbf x) = (\nabla\cdot \mathbf v)(\mathbf x), \end{align} pero el lado izquierdo es precisamente $f(\mathbf v^R)(R\mathbf x)$ y el lado derecho es $f(\mathbf v)(\mathbf x)$ por lo que tenemos \begin{align} f(\mathbf v^R)(R\mathbf x) = f(\mathbf v)(\mathbf x). \end{align} Esta es precisamente la condición que $f$ (la divergencia de un campo vectorial) sea un campo escalar bajo rotaciones.

Extensión a vectores y campos vectoriales.

Para definir un vector bajo rotaciones, y un campo de vectores bajo rotaciones, hacemos un procedimiento muy similar, pero en su lugar tenemos funciones $\mathbf f:O_1\times O_2\times\cdots \times O_n\to \mathbb R^3$ y $\mathbf f:O_1\times O_2\times\cdots \times O_n\times\mathbb R^3\to \mathbb R^3$ respectivamente (en otras palabras, el lado derecho de la flecha se cambia de $\mathbb R$ a $\mathbb R^3$ y las ecuaciones de definición de un vector y un campo de vectores se convierten en \begin{align} \mathbf f(o_1^R, \dots o_n^R) = R\,\mathbf f(o_1, \dots o_n). \end{align} y \begin{align} \mathbf f(o_1^R, \dots, o_n^R)(R\mathbf x) = R \,\mathbf f(\mathbf x) \end{align} respectivamente. En otras palabras, hay un extra $R$ multiplicando el lado derecho.

0 votos

Esto es increíblemente útil, ¡muchas gracias! Una cosa menor: creo que quieres "Considerar el caso de que v sea un campo vectorial" arriba (y "¿Es su divergencia un campo escalar?" debajo)?

0 votos

@nonagon ¡Estoy encantado de oírlo! He hecho las ediciones pertinentes.

0 votos

@joshphysics - No entiendo por qué $(R\mathbf{r_{1}})\centerdot (R\mathbf{r_{2}}) = \mathbf{r_{1}}\centerdot (R^{T} R \mathbf{r_{2}})$ . ¿Puede explicarlo?

5voto

barry Puntos 131

Creo que tienes la idea correcta, pero intentaré escribirlo en una notación más elocuente.

Lo primero que hay que dejar claro es que para esta discusión sólo trabajamos en un único punto. Sólo nos interesa transformar las coordenadas que describen el dominio en la medida en que esto induzca cambios en el direcciones en un punto. Es decir, cada punto del espacio puede tener vectores definidos en él, y una base muy conveniente para el espacio vectorial en ese momento es el conjunto de derivadas direccionales, por ejemplo $$ \mathcal{B} = \{\vec{\partial}_{(x)}, \vec{\partial}_{(y)}, \ldots\}. $$ $\vec{\partial}_{(x)}$ puntos en el $x$ -dirección; llámalo $\vec{e}_x$ si quieres. Cambiar $\{x, y, \ldots\} \to \{\bar{x}, \bar{y}, \ldots\}$ nos dará una nueva base natural $$ \bar{\mathcal{B}} = \{\vec{\partial}_{(\bar{x})}, \vec{\partial}_{(\bar{x})}, \ldots\} $$ en cada punto.

El punto de esa discusión es que las transformaciones son locales. Los números que se utilicen para identificar el punto en el espacio son irrelevantes, así que no hay que preocuparse por si llamamos al punto $(x,y)$ o $(\bar{x},\bar{y})$ . Bien, basta de alusiones a la geometría diferencial.

Veamos escalares . Un escalar es un solo número de tu campo matemático favorito. 1 Además, no se transforma cuando el dirección vectores cambian, ya que de todas formas no lleva información de dirección. Si tengo un escalar $f$ Podría decir que su representación en cualquiera de las dos bases es la misma: $$ f \stackrel{\mathcal{B},\mathcal{\bar{B}}}{\to} f. $$

Ahora considere un vector $\vec{A}$ . Como un vector siempre puede escribirse de forma única como una combinación lineal de vectores base, hagámoslo: $$ \vec{A} = A^x \vec{\partial}_{(x)} + A^y \vec{\partial}_{(y)} + \cdots. $$ Pero hay otra base flotando por ahí, y así tengo otra descomposición disponible: $$ \vec{A} = A^\bar{x} \vec{\partial}_{(\bar{x})} + A^\bar{y} \vec{\partial}_{(\bar{y})} + \cdots. $$ Para simplificar, me basta con escribir los coeficientes cuando se entiende la base: \begin{align} \vec{A} & \stackrel{\mathcal{B}}{\to} (A^x, A^y, \ldots) \\ \vec{A} & \stackrel{\mathcal{\bar{B}}}{\to} (A^\bar{x}, A^\bar{y}, \ldots). \end{align}

Las cifras $A^x$ , $A^y$ , $A^\bar{x}$ etc. son simplemente escalares en el sentido matemático, pero a menudo evitamos llamarlos escalares. En su lugar, los llamamos componentes de un vector y esperamos que colectivamente transformar como un vector cuando cambiamos de base. Es decir, si cambio de $\mathcal{B}$ a $\bar{\mathcal{B}}$ Debería reescribir $(A^x, A^y, \ldots)$ como $(A^\bar{x}, A^\bar{y}, \ldots)$ para que la colección de números siga refiriéndose al mismo vector abstracto.

La transformación real es bastante sencilla de encontrar. Siempre puedo expresar un elemento de una base en términos de la otra base. Supongamos que para $j \in \{x, y, \ldots\}$ y $\bar{\imath} \in \{\bar{x}, \bar{y}, \ldots\}$ tenemos los coeficientes ${\Lambda^\bar{\imath}}_j$ tal que $$ \vec{\partial}_{(j)} = \sum_\bar{\imath} {\Lambda^\bar{\imath}}_j \vec{\partial}_{(\bar{\imath})}. $$ Entonces \begin{align} \sum_\bar{\imath} A^\bar{\imath} \vec{\partial}_{(\bar{\imath})} & = \vec{A} \\ & = \sum_j A^j \vec{\partial}_{(j)} \\ & = \sum_j A^j \sum_\bar{\imath} {\Lambda^\bar{\imath}}_j \vec{\partial}_{(\bar{\imath})} \\ & = \sum_\bar{\imath} \sum_j {\Lambda^\bar{\imath}}_j A^j \vec{\partial}_{(\bar{\imath})}. \end{align} Como las descomposiciones de las bases son únicas, podemos leer $$ A^\bar{\imath} = \sum_j {\Lambda^\bar{\imath}}_j A^j. $$ En notación matricial, esto es $$ \begin{pmatrix} A^\bar{x} \\ A^\bar{y} \\ \vdots \end{pmatrix} = \begin{pmatrix} {\Lambda^\bar{x}}_x & {\Lambda^\bar{x}}_y & \cdots \\ {\Lambda^\bar{y}}_x & {\Lambda^\bar{y}}_y & \cdots \\ \vdots & \vdots & \ddots \end{pmatrix} \begin{pmatrix} A^x \\ A^y \\ \vdots \end{pmatrix}. $$

Cuando un físico comprueba que $\vec{A}$ transforma como un vector, lo que se suele querer decir es que tenemos un conjunto de fórmulas para $A^x, A^y, \ldots$ en $\mathcal{B}$ y otro conjunto para calcular $A^\bar{x}, A^\bar{y}, \ldots$ en $\bar{\mathcal{B}}$ y queremos asegurarnos de que los componentes describen el mismo vector abstracto $\vec{A}$ . Este es el caso si los conjuntos de componentes se transforman según la regla dada anteriormente.

En su caso, es posible que se le entregue el escalar $T$ (es decir $f$ arriba). Puede calcular los valores $\partial T/\partial x$ , $\partial T/\partial y$ etc. (Aquí es donde entra la dependencia de otros puntos, ya que a menudo te dan $T$ como función de las coordenadas para poder calcular sus derivadas parciales). Puedes ensamblar el vector (columna) $(\partial T/\partial x, \partial T/\partial y, \ldots)$ . Se podría hacer lo mismo en otra base, con otras derivadas parciales, montando $(\partial T/\partial\bar{x}, \partial T/\partial\bar{y}, \ldots)$ . No es a priori Sin embargo, está claro que estos dos conjuntos de componentes obedecerán la ley de transformación anterior. Pero, afortunadamente, el gradiente $\nabla T$ (es decir $\vec{A}$ ) definido de esta manera es un verdadero vector y se transforma correctamente.


1 $\mathbb{R}$ o $\mathbb{C}$ o lo que sea. Nótese que cuando decimos "campo" en física a menudo queremos decir "función que asigna todo el espacio en cuestión a algún tipo de objeto matemático". Así, un campo escalar asigna un escalar a cada punto del espacio, un campo vectorial asigna un vector, etc. Pero como sólo estamos hablando de lo que ocurre en un solo punto, la noción de "campo" de los físicos no es importante aquí. Si realmente quieres transformar todo un campo escalar o vectorial, sólo tienes que tomar lo que se ha hecho aquí y aplicarlo a cada punto del espacio.

0 votos

Gracias por escribir esto, ¡me gustaría poder elegir dos respuestas! Seleccioné la otra respuesta porque me ayudó más directamente a resolver los problemas que estaba abordando en Griffiths, pero esta respuesta fue bastante útil también.

0 votos

Gran respuesta. Sin embargo, el gradiente no es realmente un vector. Es un covector, ya que se encuentra en el espacio dual del espacio tangente, también llamado espacio cotangente. Las componentes de un vector se transforman de forma contravariante. Las componentes del gradiente se transforman covariantemente. Las matrices de transformación son las inversas unas de otras. Así que has cubierto uno de los dos tipos posibles de tensor de rango uno.

0 votos

Además, la matriz R no tiene por qué ser una matriz de rotación (unitaria). Cualquier matriz no singular puede servir.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X