52 votos

¿Por qué la ecuación de Euler-Lagrange no es trivial?

La ecuación de Euler-Lagrange da las ecuaciones de movimiento de un sistema con Lagrangiano $L$. Sea $q^\alpha$ la representación de las coordenadas generalizadas de un variedad de configuración, y $t$ represente el tiempo. El Lagrangiano es una función del estado de una partícula, es decir, la posición $q^\alpha$ y la velocidad $\dot q^\alpha$. La ecuación de Euler-Lagrange es

$$ \frac{d}{dt} \frac{\partial L}{\partial \dot q^\alpha } = \frac{\partial L}{\partial q^\alpha}$$

¿Por qué esta es una ley de la física y no una simple trivialidad para cualquier función $L$ en las variables $q^\alpha$ y $\dot q^\alpha? La siguiente "prueba" de la Ecuación de Lagrange no utiliza física, y parece sugerir que la Ecuación de Lagrange es simplemente un hecho matemático que funciona para cualquier función.

$$\begin{align} \frac{d}{dt} \frac{\partial L}{\partial \dot q^\alpha} & = \frac{\partial}{\partial \dot q^\alpha} \frac{dL}{dt} & \text{conmutatividad de derivadas} \\ \ \\ &= \frac{\partial \dot L}{\partial \dot q^\alpha} \\ \ \\ &= \frac{\partial L}{\partial q^\alpha} & \text{cancelación de puntos} \end{align}$$

Esto no puede estar correcto, de lo contrario a nadie le importaría esta ecuación y sería totalmente inútil para resolver cualquier problema. ¿Qué hay de malo con el razonamiento lógico anterior?

0 votos

Puedes requerir la ecuación EL para cualquier funcional. Sin embargo, tu tesis de que es una identidad general es incorrecta. ¿Dónde obtuviste las ideas para el paso 1 y 3?

0 votos

Varios comentarios que estaban respondiendo a la pregunta han sido eliminados. Por favor ten en cuenta que los comentarios deben ser utilizados para solicitar aclaraciones o sugerir mejoras al post principal, y no para responder a la pregunta.

0 votos

En realidad, para derivar las ecuaciones EL se involucra uno de los principios más importantes de la física, conocido como Principio Variacional o Principio de Hamilton. Este principio, del cual se derivan las ecuaciones EL, establece que la trayectoria que seguirá el objeto, si se le permite moverse libremente, es aquella que hace que la variación de la acción $S$ se anule. En fórmula, $\delta S = 0$

115voto

user1379857 Puntos 31

Ah, qué error tan complicado has cometido. El problema es que simplemente has confundido algunas nociones en cálculo multivariable. Sin embargo, no te sientas mal: esto generalmente está muy mal explicado. Ambos pasos 1 y 3 arriba son incorrectos. Tenga la seguridad, la ecuación de Euler-Lagrange no es trivial.

Primero demos un paso atrás. El Lagrangiano para una partícula moviéndose en una dimensión en una energía potencial externa $V(q)$ es $$ L(q, \dot q) = \frac{1}{2}m \dot q^2 - V(q). $$ Así es como la mayoría de las personas lo escriben. Sin embargo, esto es muy confuso, porque claramente $q$ y $\dot q$ no son variables independientes. Una vez que $q$ está especificado en todos los tiempos, $\dot q$ también está especificado en todos los tiempos.

Una forma mejor de escribir el Lagrangiano anterior podría ser $$ L(a, b) = \frac{1}{2}m b^2 - V(a). $$ Aquí hemos expuesto el Lagrangiano por lo que realmente es: una función que toma dos números y produce un número real. Asimismo, podemos ver claramente que $$ \frac{\partial L}{\partial a} = -V'(a) \hspace{1cm} \frac{\partial L}{\partial b} = m b. $$ Por lo general, la mayoría de las personas escriben esto como $$ \frac{\partial L}{\partial q} = -V'(q) \hspace{1cm} \frac{\partial L}{\partial \dot q} = m \dot q. $$ Sin embargo, $q$ y $\dot q$ deben entenderse como variables independientes para hacer esto correctamente. Así como $a$ y $b$ eran variables independientes, $q$ y $\dot q$ también lo son cuando se ponen en el Lagrangiano. En otras palabras, podríamos poner cualquier par de números en $L$; simplemente decidimos poner $q$ y $\dot q.

Además, analicemos la derivada total con respecto al tiempo $\frac{d}{dt}$. ¿Cómo debemos entender la siguiente expresión? $$ \frac{d}{dt} L(q(t), \dot q(t)) $$ Tanto $q$ como $\dot q$ son funciones del tiempo. Por lo tanto, $L(q(t), \dot q(t))$ depende del tiempo simplemente porque $q(t)$ y $\dot q(t)$ lo hacen. Por lo tanto, para evaluar la expresión anterior, necesitamos usar la regla de la cadena en cálculo multivariable. $$ \frac{d}{dt} L(q(t), \dot q(t)) = \frac{dq}{dt} \frac{\partial L}{\partial a}(q(t), \dot q(t)) + \frac{d \dot q}{dt} \frac{\partial L}{\partial b}(q(t), \dot q(t)) = \dot q(t) \frac{\partial L}{\partial a}(q(t), \dot q(t)) + \ddot q(t) \frac{\partial L}{\partial b}(q(t), \dot q(t)) $$

En la expresión anterior, una vez más utilicé $a$ y $b$ para hacer mi punto más claro. Debemos tomar derivadas parciales de $L$ asumiendo que $a$ y $b$ son variables independientes. DESPUÉS de diferenciar, LUEGO evaluamos $\partial L / \partial a$ y $\partial L / \partial b$ al sustituir $(q, \dot q)$ en los espacios de $(a, b)$. Esto es similar a la forma en que en cálculo de una sola variable, si tienes $$ f(x) = x^2 $$ y deseas encontrar $f'(3)$, primero diferencias $f(x)$ manteniendo $x$ como una variable no especificada, y LUEGO sustituyes $x = 3$.

En tu primer paso, las derivadas NO conmutan porque $t$ y $q$ no son independientes. ($q$ depende de $t$). Sí, las derivadas parciales conmutan, pero SOLAMENTE si las variables son independientes. En tu tercer paso, no puedes "cancelar los puntos" porque $L$ depende de dos entradas. Si $L$ solo dependiera de $q$, entonces sí, podrías "cancelar los puntos" (ya que esto es equivalente a la regla de la cadena en cálculo de una sola variable), pero no lo hace, por lo que no puedes.

EDICIÓN: Puedes ver por ti mismo que la ecuación de Euler-Lagrange no es idénticamente $0$. Si tomas el Lagrangiano $L(q, \dot q)$ que he escrito arriba y lo sustituyes en la ecuación de Euler-Lagrange, obtienes $$ m \ddot q(t) + V'(q(t)) = 0. $$ Esto no es lo mismo que $0 = 0$. Es una condición que una trayectoria $q(t)$ debería satisfacer para extremizar la acción. Si fuera $0 = 0$, entonces todas las trayectorias extremizarían la acción.

EDICIÓN: Como señala Arthur, este es también un buen momento para discutir la diferencia entre $dL / dt$ y $\partial L / \partial t$. Si tenemos un Lagrangiano dependiente del tiempo, $$ L(q, \dot q, t) $$ entonces $L$ puede depender explícitamente de $t$, en lugar de simplemente a través de $q$ y $\dot q. Entonces, por ejemplo, mientras que podríamos tener el Lagrangiano para una partícula en un campo gravitacional constante $g$ como $$ L(a,b) = \frac{1}{2} mb^2 - m g a $$ si permitimos que $L$ dependa explícitamente de $t$, podríamos tener el campo gravitacional volverse más fuerte con el tiempo: $$ L(a,b,t) = \frac{1}{2} mb^2 - m ( C t )a. $$ ($C$ es una constante tal que $Ct$ tiene las mismas unidades que $g$.)

La cantidad $$ \frac{\partial}{\partial t} L(a, b, t) $$ debe entenderse como la diferenciación de la "ranura t" de $L. En el ejemplo anterior, tendríamos $$ \frac{\partial}{\partial t} L(a,b,t) = - m C a. $$ La cantidad $$ \frac{d}{d t} L(q(t), \dot q(t), t) $$ debe entenderse como la derivada de tiempo completo de $L$ debido al hecho de que $q$ y $\dot q$ también dependen de $t. Para el ejemplo anterior, \begin{align*} \frac{d}{d t} L(q(t), \dot q(t), t) &= \dot q(t) \frac{\partial L}{\partial a}(q(t), \dot q(t),t) + \ddot q(t) \frac{\partial L}{\partial b}(q(t), \dot q(t),t) + \frac{\partial L}{\partial t} (q(t), \dot q(t), t) \\ &= (\dot q) (-mC t ) + \ddot q(t) (m \dot q(t)) - mC q(t) \end{align*}

13 votos

Gracias por una respuesta exhaustiva. Necesitamos más de esas en la Red de Stack Exchange.

13 votos

Las ecuaciones de Euler-Lagrange fue la primera vez que aprecié adecuadamente la diferencia entre $\partial$ y $\mathrm d$ en las derivadas. Por ejemplo, dada una función $L(t, q, \dot q)$, la expresión $\frac{\partial L}{\partial t}$ significa "Diferenciar la función multivariable $L(t, q, \dot q)$ con respecto a la primera variable", mientras que $\frac{\mathrm dL}{\mathrm dt}$ significa "Diferenciar la función de una sola variable $L(t, q(t), \dot q(t))$ con respecto a la variable $t"$.

4 votos

+1 Soy un gran fan de escribir $L(a,b)$ para enfatizar que $L$ solo depende de dos variables. Pero tal vez ayudaría enfatizar un pequeño detalle: que al calcular la acción (y por lo tanto encontrar las ecuaciones E-L), sustituimos funciones del tiempo $q(t)$ y $\dot{q}(t)$ por $a$ y $b$. De lo contrario, parece que el Lagrangiano es una función del tiempo y, al mismo tiempo, no lo es.

21voto

Stefano Puntos 763
  1. El conmutador $$\left[\frac{\partial}{\partial \dot{q}^j},\frac{\mathrm d}{\mathrm d t}\right]~\stackrel{(2)}{=}~\frac{\partial}{\partial q^j}\tag{1}$$ de una derivada de velocidad $\frac{\partial}{\partial \dot{q}^j}$ con la derivada total respecto al tiempo $$\frac{\mathrm d}{\mathrm d t} ~=~\frac{\partial}{\partial t} +\dot{q}^j\frac{\partial}{\partial q^j} +\ddot{q}^j\frac{\partial}{\partial \dot{q}^j} +\dddot{q}^j\frac{\partial}{\partial \ddot{q}^j} +\ldots \tag{2}$$ no es cero. Ver también por ejemplo esta publicación relacionada en Math.SE y esta publicación relacionada en Phys.SE.

  2. La cancelación de puntos $$\frac{\partial \dot{L}}{\partial \dot{q}^j}~=~\frac{\partial L}{\partial q^j}\tag{3}$$ funciona para funciones $L(q,t)$ que no dependen de velocidades $\dot{q}^k$. Pero un Lagrangiano típicamente depende de velocidades. Ver también esta publicación relacionada en Phys.SE.

  3. Nota el siguiente lema algebraico de Poincaré: $$L\text{ satisface las ecuaciones de Euler-Lagrange (EL) de forma idéntica }$$ $$\quad\Updownarrow\quad\tag{4}$$ $$L\text{ es una derivada total respecto al tiempo}$$ (modulo posibles obstrucciones topológicas). Para más detalles, ver por ejemplo esta y esta publicación en Phys.SE.

0 votos

Me gustó tu respuesta la mejor fue corta y muy concisa y directamente al punto. Ojalá pudiera haberla escrito yo.

8voto

KONSTANTIN Puntos 36

Entonces, en principio uno puede elegir esencialmente $\it{cualquier}$ Lagrangiano $\mathcal{L}$ con coordenadas suficientemente elegidas (y posiblemente restricciones), y aplicar cálculo variacional a través de las ecuaciones de Euler-Lagrange. Las ecuaciones de movimiento que esto produce pueden o no corresponder a un modelo comprensible de la realidad. Hay muchos Lagrangianos que no corresponden a la realidad (aparentemente). Los Lagrangianos que producen modelos físicos generalmente se han encontrado por ensayo y error y consulta con experimentos/observaciones.

¿por qué es esta una ley fundamental de la física y no una simple trivialidad de CUALQUIER función L en las variables $q$ y $\dot{q}$?

El formalismo de Euler-Lagrange no es una "ley fundamental de la física." Más bien, es una ecuación diferencial parcial (o un conjunto de ellas) cuyas soluciones hacen que una función en particular sea estacionaria, lo que significa que las soluciones obedecen el principio de acción extremizada. Este concepto matemático fue realmente generalizado en la teoría de control por el principio del máximo de Pontriaguin. Las leyes de la física son derivables a través del método de Euler-Lagrange, pero el método no es fundamental, similar a cómo la geometría particular elegida no es fundamental para derivar las leyes físicas. Los físicos usan matemáticas para modelar la realidad, ¡así que por supuesto que vamos a usar las cosas que funcionan! Por ejemplo, Einstein derivó sus ecuaciones de campo heurísticamente, pero Hilbert las derivó (alrededor del mismo tiempo) a partir del principio de acción al adivinar el correcto $\mathcal{L}$. Pero hoy en día, casi todos los que trabajan con relatividad general o gravedad modificada comienzan desde $\mathcal{L}$ y usan el principio de acción (excepto en cosmología donde típicamente comienzan desde la métrica misma).

No es del todo sorprendente que, ya que somos criaturas naturales que evolucionaron para entender patrones de nuestro entorno, las herramientas que creamos - especialmente las abstractas como las matemáticas - puedan tener alguna correspondencia con la realidad. Eugene Wigner escribió un ensayo muy interesante sobre este tema, llamado "La Efectividad Irrazonable de las Matemáticas en las Ciencias Naturales", en el que argumenta que es obvio que las matemáticas funcionan tan bien modelando la realidad, pero no es en absoluto obvio por qué esto funciona.

Las preguntas de "por qué" son muy difíciles de responder, y esta es especialmente difícil. Algunos Lagrangianos funcionan para producir modelos físicos, y algunos no, y tal vez las ecuaciones de E-L funcionan como un filtro para descubrir eso ya que puede usarse para hacer predicciones comprobables.

@ AccidentalFourierTransform ya aclaró tus errores matemáticos, así que no lo haré.

0 votos

No estoy siguiendo tu argumento de que las ecuaciones no son una ley de la física. Con definiciones típicas, ¿las ecuaciones no son perfectamente equivalentes a la segunda ley de Newton, que es inequívocamente una ley? Sin querer entrar en un debate sobre la definición de "ley física", pero algo de claridad aquí podría ser útil.

0 votos

Por supuesto, como mencionaste, la misma definición de "ley física" está sujeta a debate, pero según el artículo de wiki que enlacé, dice "Las leyes físicas son típicamente conclusiones basadas en experimentos científicos repetidos y observaciones a lo largo de muchos años que han sido aceptadas universalmente dentro de la comunidad científica." Las ecuaciones de E-L son un formalismo matemático, específicamente la EDP que resuelves para extremizar una acción. El Principio de Acción no es una ley, sino un principio teórico que produce modelos muy útiles, similares a otros principios, por ejemplo, el principio de relatividad. ¿Te ayudo?

0 votos

Entonces, para recalcar el punto, las Leyes de Newton sobre el movimiento están verificadas empíricamente, mientras que las ecuaciones E-L son un método por el cual se derivan esas Leyes del Movimiento. Las Leyes de Newton pueden ser tomadas como axiomas, o pueden ser derivadas, pero las llamamos "leyes" porque son empíricas.

3voto

Benedata Puntos 1

Su pregunta: ''¿Por qué la ecuación de Lagrange no es una trivialidad? ¿Qué está mal en mi cálculo?''.

Primero, algo de notación. Utilizando la notación no ambigua de SICM, las ecuaciones de Lagrange son:

$$\mathrm{D}((\partial_2 L) ∘ Γ[q]) - (\partial_1 L) ∘ Γ[q] = 0$$ (donde $\mathrm{D}$ es la derivada total (corresponde a la derivada temporal), y $Γ[q] = (q, \mathrm{D}q, ...)$ es el funcional que proporciona la trayectoria y su(s) derivada(s).)

(Si te preguntas qué está mal con la notación tradicional, entonces recomiendo leer el prefacio de SICM que aborda esto, pero básicamente se refiere a confusiones exactamente como las de esta pregunta.)

Intentar reescribir tu cálculo utilizando la notación no ambigua de SICM revela inmediatamente algunos problemas:

Imposible simplemente conmutar derivadas: Ni $$\mathrm{D}((\partial_2 L) ∘ Γ[q]) \neq \partial_2((\mathrm{D} L) ∘ Γ[q])$$ ni $$\mathrm{D}((\partial_2 L) ∘ Γ[q]) \neq \partial_2\mathrm{D} (L ∘ Γ[q])$$ tienen sentido.

Imposible cancelar puntos: $$\partial_2\mathrm{D} (L ∘ Γ[q]) \neq \partial_1 (L ∘ Γ[q])$$ tanto en la izquierda como en la derecha parecen bastante insensatos.

Luego necesitas hacer $$\partial_1 (L ∘ Γ[q]) = (\partial_1 L) ∘ Γ[q]$$ para reconstruir una expresión coherente.

Por lo tanto, ningún paso en tu demostración está justificado.

1 votos

Esta notación parece un poco confusa. No sugiere explícitamente las variables (1 y 2 podrían ser cualquier cosa). ¿Es la composición funcional? ¿Representa $\Gamma [q]$ un producto interno? Hasta donde puedo decir, su principal ventaja es la facilidad de uso con un lenguaje de programación en particular, pero podría ser un poco poco familiar. También existe la posibilidad de confusión con los símbolos de Christoffel o la función gamma. ¿Podrías explicarlo un poco más detalladamente en tu respuesta?

0 votos

@Obie2.0, te recomiendo el prólogo de SICM para explicar la razón de la notación diferente, pero intentaré explicarlo un poco mejor en mi respuesta.

0 votos

+1, esta notación lo hace mucho mejor!

1voto

Jim Geurts Puntos 220

¡Esa es una interesante secuencia de manipulaciones simbólicas!

Es debido a la falta de rigor que es fácil caer en estos errores y típicamente los textos de física no explican dónde están y por qué y cómo evitarlos. Es una habilidad que se adquiere resolviendo problemas, estudiando la teoría y leyendo al respecto.

Problemas similares están asociados con la integral de camino que no tiene una definición rigurosa. Sin embargo, el cálculo variacional puede hacerse riguroso. Sin embargo, esto es difícil. Normalmente no se toca en un curso de matemáticas de pregrado donde definirán rigurosamente cálculo para una variable real, para una variable compleja y muchas variables reales, ya sea cálculo en una variedad o más típicamente, cálculo multivariable, que es cálculo en un espacio vectorial (de dimensión finita).

Para hacer que las matemáticas sean rigurosas en esto se requiere del aparato de módulos de chorro. Puede encontrar una exposición en los libros de Saunders Módulos de Chorro y Michor Operaciones Naturales. Requiere bastante desarrollo.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X