7 votos

Intuición física sobre el tensor de inercia

Estoy estudiando Mecánica en el libro de Goldstein (Mecánica Clásica) y en el de Spivak (Física para Matemáticos) y tengo dudas sobre la intuición física sobre el tensor de inercia. En ambos libros, el tensor de inercia aparece de forma natural al calcular el momento angular $L$ de un cuerpo rígido que, para simplificar, sólo gira.

El tensor de inercia se define entonces como el operador lineal $I : \mathbb{R}^3 \to \mathbb{R}^3$ dada por

$$I(\phi) = \sum_{i} m_i b_i \times (\phi \times b_i),$$

donde $b_i\in \mathbb{R}^3$ son las posiciones iniciales de las partículas del cuerpo, y $m_i$ sus masas. Con esta definición, se demuestra que

$$L = I(\omega),$$

en $\omega$ la velocidad angular del cuerpo rígido. Todo eso, desde el punto de vista matemático, está muy bien.

Ahora bien, ¿cuál es la intuición física que hay detrás de esto? El operador lineal $I$ permite relacionar de forma lineal la velocidad angular y el momento angular. Esto se parece mucho a la masa relaciona de forma lineal la velocidad y el momento. Pero en este último caso, la masa es un escalar mientras que $I$ es una transformación lineal.

¿Cuál es, entonces, la mejor manera de entender físicamente el tensor de inercia?

2voto

Zhengyan Shi Puntos 609

Tiene razón al decir que $I$ permite relacionar de forma lineal la velocidad angular y el momento angular. Pero no es tan sencillo como en el caso del momento y la velocidad. Una intuición de por qué las cosas se complican es que $L = r \times p $ implica un producto cruzado que lo hace muy sensible a la elección de un conjunto específico de bases ortonormales (con origen fijo). Mientras que $p=mv$ implica una masa escalar que es independiente de su elección de coordenadas.

Para explicar el tensor de inercia, supongo que podríamos empezar con casos más sencillos en los que haya suficiente simetría (por ejemplo, una esfera en 3D o una tortita circular en 2D), $L = I(\omega)$ se reduce a $L = I\omega$ donde $L$ y $\omega$ son vectores y $I$ es sólo un escalar. Una intuición para esta reducción es que la simetría hace que $I$ se parecen a $m$ más. Como he mencionado antes, la masa es siempre independiente de la elección de coordenadas. pero $I$ sólo es independiente de las coordenadas que PRESERVAN la simetría. Por lo tanto, las esferas y las tortitas circulares son bastante fáciles de tratar y no es necesario ningún tensor de inercia.

Pero para un cuerpo rígido general, extendido, en 3d, la falta de simetría rompe la simple relación lineal. Supongamos que tenemos una base ortonormal, cuyo origen es la esquina de un cubo y los ejes se alinean con las aristas del cubo. Básicamente, cuando el cubo gira alrededor del eje z, todas las partes del cubo también giran instantáneamente en las otras direcciones (si dibujas un diagrama, quedará claro). Por lo tanto $\omega_z$ afecta a $L_y$ y $L_x$ . No veo una explicación intuitiva de los detalles cuantitativos .. Pero este sencillo ejemplo de cubo muestra que $L_x, L_y, L_z$ deben ser cada una una combinación lineal de $\omega_x, \omega_y, \omega_z$ . Y la expresión matemática que cuantifica esto debe ser una matriz.

*Un desvío matemático: esta matriz en sí no es un tensor, sino más bien una REPRESENTACIÓN de un tensor que mapea vectores de velocidad angular a vectores de momento angular DUAL. En notación de índice abstracto, $L_\alpha = I_{\alpha\beta}\omega^\beta $ Verá muchas notaciones similares en E&M, Relatividad, etc.

2voto

MW99 Puntos 1

Así que estamos hablando de dos cosas distintas. Parece que no te importa un poco de notación avanzada, así que voy a tratar de usar eso para ilustrar el lado matemático de la física que estoy hablando.

Rigidez y eje de rotación

Una de las cosas de las que hablamos es que el objeto es rígido lo que significa que está compuesto por un montón de partículas cuyas distancias son fijas. La forma matemática de decir tis es que su en cualquier momento debe ser representado por un isometría y el grupo de isometrías es $T(3) \times O(3).$ De hecho, la isometría tiene que ser continua con la identidad por lo que en el espacio euclídeo infinito normal podemos especificar a $T(3) \times SO(3),$ traslaciones más rotaciones. Sólo para trabajar la idea básica, dejemos que los índices griegos sean coordenadas y los índices latinos sean partículas, de modo que podamos usar la suma de Einstein sobre los índices griegos. Intentaré usar algunos tensores métricos explícitos $g_{\alpha\beta}$ para denotar el producto punto, para mantener los índices latinos y griegos visiblemente separados. Las partículas tienen vectores de posición $r_n^\alpha$ pero las distancias entre esas partículas son constantes, por lo que $$\frac{d}{dt} \left[g_{\alpha\beta} ~(r_m^\alpha - r_n^\alpha)~(r_m^\beta - r_n^\beta)\right] = 2 g_{\alpha\beta} ~(r_m^\alpha - r_n^\alpha)~(\dot r_m^\beta - \dot r_n^\beta) = 0.$$ Dada una orientación (totalmente antisimétrica $[0,\;n]$ tensor $\epsilon$ en nuestro $\mathbb R^n$ espacio) podemos describir la rotación con un $[n-2,\;0]$ tensor $\Omega$ como $$\dot r^\beta_m = \chi^\beta + g^{\beta\gamma}\epsilon_{\gamma\delta\Lambda}~\Omega^\Lambda~r_m^\delta.$$ Esta forma funcional hace que el término anterior sea $\epsilon_{\alpha\delta\Lambda}~\Omega^\Lambda~R_{mn}^\alpha~R_{mn}^\delta = 0$ debido a la antisimetría del $\epsilon$ donde la forma exacta de $R^\alpha_{mn} = r^\alpha_m - r^\alpha_n$ no importa, al igual que $\Omega^\Lambda$ no importa, al derivar que $0$ . Es puramente por antisimetría. En 2D, $\Omega^\Lambda$ es un escalar; en 3D es un vector; en dimensiones superiores es un tensor, pero en cada caso se convierte en esta matriz antisimétrica $\Omega_{\gamma\delta} = \epsilon_{\gamma\delta\Lambda} ~\Omega^\Lambda.$ El hecho de que todas las rotaciones puedan representarse mediante estas matrices antisimétricas va a ser muy útil dentro de un momento. No estoy seguro de si en dimensiones superiores también salen otros términos; mi pensamiento era simplemente "o necesitas que la velocidad desaparezca directamente o que sea perpendicular a la posición".

Momento angular

Otra es que, debido a que la fórmula de las energías cinética y potencial no dependen de la rotación (una simetría continua), existe una corriente de Noether conservada asociada a esa simetría: el momento angular. En este caso nuestro Lagrangiano tiene la forma $$\frac12 \sum_n m_n g_{\alpha\beta} \dot r_n^\alpha \dot r_n^\beta - \sum_{mn} U_{mn}\left[g_{\alpha\beta} ~ (r_m^\alpha - r_n^\alpha)~(r_m^\beta - r_n^\beta)\right],$$ para un conjunto de potenciales fuertes que obligan al cuerpo a permanecer rígido $U_{mn}.$ Puesto que son simétricos en rotación, y el término cinético es simétrico en rotación, el teorema de Noether dice que, por tanto, obtenemos una cantidad conservada para cualquier desplazamiento infinitesimal que respete la simetría $\delta r^\alpha$ de $$Q = \sum_n \frac{\partial L}{\partial \dot r_n^\alpha} ~\delta r_n^\alpha.$$ De nuevo, la rotación se convierte en una matriz antisimétrica, $\delta r_n^\alpha = g^{\alpha\mu}~\delta\phi_{\mu\nu}~r_n^{\nu},$ por lo que lo anterior se convierte en: $$Q = \sum_n m_n g_{\alpha\beta}~\dot r_n^\beta ~g^{\alpha\mu}~\delta\phi_{\mu\nu}~r_n^{\nu}= \delta\phi_{\mu\nu}~\sum_n m_n~\dot r_n^\mu ~r_n^{\nu} = \delta\phi_{\mu\nu}~Q^{\mu\nu}.$$ Por lo tanto, esta cantidad conservada tiene un $[2,\;0]$ carácter tensorial, ya que podemos elegir cualquier eje para esta rotación. Además, cualquier parte simétrica de este tensor quedará anulada por la antisimetría de la rotación, así que sin pérdida de generalidad podemos antisimetrizarlo también. La notación habitual para esto es escribir $Q^{[\mu\nu]}$ entre corchetes, $$Q^{[\mu\nu]} = \frac12 (Q^{\mu\nu}-Q^{\nu\mu})=\sum_n m_n ~\dot r_n^{[\mu} ~r_n^{\nu]}.$$

Reunirlos

Hemos visto aquí dos expresiones fundamentalmente diferentes: una es el tensor de velocidad angular $\Omega_{\alpha\beta}$ que procede de la rigidez del sistema; el otro es el tensor de momento angular $Q^{\mu\nu},$ que se deriva de la simetría en las ecuaciones de movimiento. Obviamente no son definió lo mismo pero ambos resultan ser antisimétricos. ¿Cuál es la relación entre ellas? Es fácil: sustituye el término rotacional del $\Omega$ expresión para $\dot r_n^\beta$ en el mismo $\dot r$ término en la energía cinética a encontrar: $$Q^{[\mu\nu]} = -\left[\sum_n m_n~r_n^{[\nu}~g^{\mu]\gamma}~r_n^{\delta} \right]~\Omega_{\gamma\delta}.$$ Aquí vemos que a $[4,\;0]$ tensor los relaciona linealmente y tiene $\nu$ - $\delta$ y $\mu$ - $\gamma$ simetría pero $\nu$ - $\mu$ antisimetría. Así que siempre están en una relación directa a través de este tensor de momento de inercia, y eso es básicamente porque las velocidades de las partículas en torno al centro de masa contribuyen directamente al momento angular y están directamente determinadas por un tensor de momento de inercia.

Por supuesto, en $\mathbb R^3$ resulta que es más fácil trabajar con los vectores momento angular y velocidad angular; escribimos $Q^{\mu\nu}$ como $Q_\lambda~\epsilon^{\lambda\mu\nu}$ y observe que para la orientación más común (donde $\epsilon_{123} = 1$ ) tenemos $\epsilon^{\alpha\beta\gamma}\epsilon_{\beta\gamma\delta} = 2\delta^\alpha_\delta,$ para que $$Q_\lambda = \frac12 \left[\sum_n m_n~\epsilon_{\lambda\mu\nu}~g^{\mu\gamma}~r_n^\nu ~r_n^\delta~\epsilon_{\gamma\delta\kappa} \right] \Omega^\kappa.$$ Así que en $\mathbb R^3$ encontramos una $[0,\;2]$ -tensorial entre las mismas magnitudes, porque ambas matrices de momento angular son secretamente vectores de momento angular.

No estoy del todo seguro de haber explicado bien todos los detalles, pero ésa es la historia general. Los dos conceptos son diferentes, en parte porque uno contiene ideas de "masa" que son diferentes en distintas direcciones y el otro no; pero resultan estar linealmente relacionados a través de los términos $\dot r_n^\alpha$ . Son matrices secretamente antisimétricas con una relación lineal, pero pueden ser convertidas a la baja en $\mathbb R^2$ a escalares o en $\mathbb R^3$ a vectores o en $\mathbb R^4$ a pares de vectores en $\mathbb R^3.$

1voto

Tom Puntos 21

Para tener intuición, recomiendo no empezar por la definición, sino por el problema que intentas resolver. Es decir, dado un cuerpo rígido $B$ con una determinada velocidad angular $\vec{\omega}$ alrededor de su centro de masa, ¿cuál es su momento angular $\vec{L}$ ? Defina el "momento de inercia" como la propiedad de $B$ que determina el valor de $\vec{L}$ dado $\vec{\omega}$ .

Definido de este modo, el "momento de inercia" podría ser, en principio, una función terriblemente complicada que dependiera de algún modo no lineal de la forma del cuerpo rígido. Después de todo, hay infinitos vectores de entrada posibles $\vec{\omega}$ y, a priori, podrían dar lugar a valores de $\vec{L}$ según algún cálculo loco que requiere llevar un registro explícito de la posición exacta de cada partícula del cuerpo rígido.

Lo que nos salva de esta pesadilla es que el vector de salida $\vec{L}$ depende linealmente sobre el vector de entrada $\vec{\omega}$ . ¿Cómo podemos ver que esto es cierto? Bueno, es bastante intuitivo que si se duplica $\vec{\omega}$ entonces duplicarás $\vec{L}$ así que es un buen comienzo. Lo que es menos obvio es que si $\vec{L}_1$ es el momento angular correspondiente a una determinada velocidad angular $\vec{\omega}_1$ y $\vec{L}_2$ es el momento angular correspondiente a una determinada velocidad angular $\vec{\omega}_2$ entonces el momento angular correspondiente a $\vec{\omega}_1 + \vec{\omega}_2$ est $\vec{L}_1 + \vec{L}_2$ . Pero, intuitivamente, puedes convencerte de ello si imaginas el caso especial en el que $\vec{\omega}_1$ puntos a lo largo del $x$ -eje y $\vec{\omega}_2$ puntos a lo largo del $y$ -y se calcula el momento angular de un elemento infinitesimal del cuerpo rígido en $(x,y)$ girando primero según $\vec{\omega}_1$ entonces, según $\vec{\omega}_2$ y, por último, según $\vec{\omega}_1 + \vec{\omega}_2$ . Y si la linealidad se mantiene a nivel infinitesimal, entonces debe mantenerse en todo el cuerpo rígido, porque la integración es lineal.

Una vez que haya establecido que $\vec{L}$ depende linealmente de $\vec{\omega}$ básicamente ya está; eso es lo que un tensor de rango 2 est -algo que te da un vector de salida a partir de un vector de entrada de forma lineal. Así que, después de todo, el momento de inercia no es una función incomprensiblemente complicada del cuerpo rígido; como es un tensor de rango 2 en 3 dimensiones, está determinado por (como máximo) 9 números. Estos números capturan la resistencia del cuerpo a la torsión en tres direcciones independientes, y la linealidad nos permite derivar su resistencia a la torsión en a dirección.

Por cierto, esta forma de pensar también ayuda a ver que el momento de inercia es alguna propiedad física del objeto que disfruta de una existencia independiente de nuestra elección del sistema de coordenadas. La velocidad angular y el momento angular son físicos, y la relación entre ellos depende sólo de la estructura física del cuerpo rígido. Pensar en el tensor del momento de inercia como una relación lineal independiente de las coordenadas entre magnitudes independientes de las coordenadas (vectores) nos permite derivar la ley de transformación cuando cambiamos de coordenadas (a diferencia de tomar la ley de transformación como la definición de un tensor, lo que siempre me ha parecido muy confuso).

Una observación más. El ejercicio anterior, en el que interviene un elemento infinitesimal del cuerpo rígido, nos ayuda a ver por qué el tensor del momento de inercia no se describe con un solo número. Es decir, $\vec{L}$ no es sólo un múltiplo escalar de $\vec{\omega}$ porque la misma velocidad angular alrededor de dos ejes diferentes dará lugar a diferentes magnitudes del momento angular, dependiendo de lo lejos que esté la masa del eje de rotación. Así que necesitamos más de un número. Ahora bien, como sin duda sabrás, el tensor del momento de inercia es en realidad un simétrico por lo que no se necesitan 9 números para describirlo, sino 6. Esta simetría no se deduce sólo del hecho general de que $\vec{L}$ depende de $\vec{\omega}$ de forma lineal; es un hecho especial de la mecánica de los cuerpos rígidos. Pero creo que el principal obstáculo para la intuición es comprender qué significa físicamente un tensor de rango 2, y en eso me he centrado aquí.

0voto

Andrea Di Persio Puntos 1226

El tensor de inercia es el objeto que nos indica cómo se convierte la velocidad angular en energía cinética o momento angular y, por tanto, desempeña un papel similar al que desempeña la masa en el movimiento rectilíneo. Para entender físicamente por qué este factor de conversión es sólo un número en un caso pero es un tensor en el otro sólo tenemos que observar que ambas cantidades representan la inercia total del sistema.

Debido a la isotropía del espacio, la inercia de la partícula en movimiento rectilíneo está completamente determinada por un solo parámetro, la masa. Sin embargo, en el movimiento de rotación, los distintos ejes de rotación de un mismo cuerpo presentan, en general, inercias diferentes y un único escalar no bastará para describir cómo se convierte la velocidad angular en energía cinética. Para describir completamente la inercia del cuerpo con respecto a un punto dado necesitamos en general seis parámetros, tres para fijar la orientación de los ejes de coordenadas y tres para cuantificar la inercia con respecto a cada uno de estos ejes.

Al tener que especificar seis números, la inercia del cuerpo requiere al menos un tensor simétrico de segundo rango para ser representado por. Si el cuerpo tiene simetrías particulares, el número total de parámetros diferentes se reduce. Por ejemplo, consideremos una esfera homogénea centrada en el origen que es fijo. Con respecto a ese punto, todas las orientaciones de los ejes son equivalentes, por lo que no necesitamos ningún parámetro para fijar el sistema de coordenadas. Además, las rotaciones a lo largo de cada uno de los tres ejes también son equivalentes, la inercia debe ser la misma. Por lo tanto, la inercia de la esfera homogénea se describe mediante un único escalar y el tensor de inercia es un múltiplo del tensor de identidad.

0voto

ollyc Puntos 691

Yo también me he encontrado con el mismo problema hasta que hace poco comprendí el significado de los índices.

Aunque hay muchas definiciones de tensor, nos queda decidir cuál es la más adecuada para el contexto en el que nos encontramos.

$I_{xy}$ significa cuánto se aceleraría el objeto 3D en el $y$ eje cuando aplico el par en el $x$ eje.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X