Se ha escrito en Goldstein de la Mecánica Clásica que en el formalismo de Lagrange, independiente de la dinámica de las variables se $q$$t$. Es por eso que tratamos de representar el estado de un sistema en el formalismo de Lagrange usando un punto en el espacio de configuración. Pero a lo largo de los cálculos tratamos $\dot{q}$ también como una variable independiente, como para los cálculos de Euler-Lagrange ecuación. También, Goldstein menciona que matemáticamente tratamos $\dot{q}$ como variable independiente, pero aparte de que no es así. ¿Cómo puede un matemáticamente independiente de la cantidad no se considera así, mientras que la comprensión de la dinámica del sistema como en las que se indica el estado de su?
Respuestas
¿Demasiados anuncios?No tratamos $\dot q$ como una variable independiente en la derivación de Euler-Lagrange las ecuaciones. La respuesta aproximada es que $q$ $\dot q$ son independientes como insumos para el Lagrangiano, pero se vinculan una vez que especificar una ruta de acceso a través de la configuración espacio - ampliar sobre esto en los puntos 5 y 6.
Voy a ser muy formal en lo que sigue, pero tal vez la formalidad será un poco esclarecedor. En primer lugar, unos preliminares:
1: El estado de una $N$-dimensiones del sistema consta de un punto de $$q\equiv(q_1,q_2,\ldots,q_N)\in \bf{Q}$$ where $\bf{Q}$ is called the configuration space corresponding to the system, and $q_i$ is the $i^{th}$ generalizada de coordenadas.
2: Una curva de $\gamma$ a través de la configuración del espacio es un mapa $$ \gamma : \mathbb{R} \rightarrow \bf{Q}$$ $$ t \mapsto \gamma(t)=\big(q_1(t),q_2(t),\ldots,q_N(t)\big)\equiv q_\gamma(t)$$ La curva es, por tanto, parametrizada por $t$, lo que llamamos el tiempo. Este documento describe la forma en que el estado de el sistema evoluciona. Tenga en cuenta que vamos a exigir que se $\gamma$ ser al menos dos veces diferenciable.
3: En cada punto a lo largo de $\gamma$, existe un único vector tangente $V_\gamma(t)$ da de la siguiente manera: $$ V_\gamma : \mathbb{R} \rightarrow \bf{T_qQ}$$ $$ t \mapsto V_\gamma(t)=\big(\dot q_1(t),\dot q_2(t),\ldots,\dot q_N(t)\big)\equiv \dot q_\gamma(t)$$ $\mathbf{T_qQ}$ es llamado el espacio de la tangente a $\bf{Q}$ en el punto de $q$. No voy a molestar a la definición de este rigor, pero la idea intuitiva de un espacio de la tangente debe estar familiarizado si usted está recogiendo Goldstein.
4: La inconexión de la unión de todos los de la tangente espacios de $\bf{Q}$ se llama la tangente paquete a $\bf{Q}$, y se denota $\bf{TQ}$: $$ \bf{TQ} = \underset{q\in\bf{Q}}{\sqcup}\bf{T_qQ}$$ Si $(q,v)$ es un elemento de la tangente bundle $\bf{TQ}$, entonces eso significa que $v$ es un vector tangente a algunos curva pasa por el punto de $q$.
5: El Lagrangiano es una función que toma tres (o dos, dependiendo de su punto de vista) entradas - un punto de $(q,v) \in\bf{TQ}$, y un número real $t\in \mathbb{R}$ - y los asigna a un número real: $$ L : \bf{TQ} \times \mathbb{R} \rightarrow \mathbb{R}$$ $$ (q,v, t) \mapsto L(q,v, t)$$ Un punto crucial es que el $q$ no determina el $v$ - $L$ le preocupa, $q$ es sólo un punto en $\bf{Q}$ $v$ es el vector tangente a la una de la infinidad de curvas que pasa a través de $q$.
6: La acción funcional $S$ mapas de una curva de $\gamma$ a un número real, de la siguiente manera: $$S[\gamma] = \int L\big(q_\gamma(t),\dot q_\gamma(t), t\big) dt $$ Reiterar el punto anterior, el Lagrangiano tiene tres ranuras - una para un punto en el espacio de configuración, uno por un vector tangente, y uno para un número real. Tan lejos como $L$ se refiere, estos tres ranuras son independientes, así que podemos tomar derivadas parciales en nuestro ocio.
Cuando se ejecuta la acción funcional, caminamos a lo largo de la curva de $\gamma$. En cada una de las $t$, damos de comer a $\gamma(t)\equiv q_\gamma(t)$ en la primera ranura, $V_\gamma(t) \equiv \dot q_\gamma(t)$ en la segunda ranura, y $t$ en la tercera ranura. Pero no se puede enfatizar lo suficiente que el Lagrangiano de sí mismo no tiene ninguna idea de que las tres entradas tienen nada que ver el uno con el otro.
Ahora que eso está fuera de la forma, podremos conseguir abajo al negocio. Buscamos alguna $\gamma$ para que la acción funcional es estacionaria. Intuitivamente, podemos pensar en "tomar la derivada y póngalo a cero", pero en esta etapa no es muy claro cómo tomamos la derivada con respecto a una curva.
En su lugar, vamos a hacer lo siguiente. Indicar el correcto (pero desconocido) de la curva de $\gamma_c$. A continuación, un general de la curva de $\gamma$ puede ser escrito como la "suma" de $\gamma_c$ y algún "error" $\eta$ que se desvanece en los extremos de la integral, y donde la suma se define el componente racional. En otras palabras, en algún momento $t$,
$$q_\gamma(t) = q_c(t)+\epsilon\eta(t) \equiv \big(q_{c1}(t)+\epsilon\cdot\eta_1(t),q_{c2}(t)+\epsilon\cdot\eta_2(t),\ldots,q_{cN}(t)+\epsilon\cdot\eta_N(t)\big)$$
mientras que el vector tangente (también llamado generalizado de la velocidad) se convierte en $$\dot q_\gamma(t) = \dot q_c(t)+\epsilon\cdot \eta'(t)\equiv \big(\dot q_{c 1}(t)+\epsilon\cdot\eta_1'(t),\dot q_{c 2}(t)+\epsilon\cdot\eta_2'(t),\ldots,\dot q_{cN}(t)+\epsilon\cdot\eta_N'(t)\big)$$
donde $\epsilon\in \mathbb{R}$. En lugar de preocuparse por los detalles de funcionales derivados, podemos buscar un camino de $\gamma$ lo que hace que la acción integral estacionaria con respecto a los cambios en $\epsilon$: $$ \frac{dS[\gamma]}{d\epsilon} = 0$$
La acción se convierte en funcional $$S[\gamma] = \int_A^B L\big(q_\gamma(t),\dot q_\gamma(t),t\big) dt=\int_A^B L\big(q_c(t)+\epsilon\cdot\eta(t),\dot q_\gamma(t)+\epsilon\cdot\eta'(t),t\big) dt$$
Diferenciando con respecto a $\epsilon$ da $$\frac{dS[\gamma]}{d\epsilon} = \int_A^B\sum_{i=1}^N\left[ \frac{\partial L}{\partial q_{\gamma i}}\eta_i(t) + \frac{\partial L}{\partial \dot q_{\gamma i}} \eta_i'(t) \right]dt$$
Ahora reconocemos que
$$ \frac{\partial L}{\partial \dot q_{\gamma i}} \eta_i' (t) = \left[\frac{\partial L}{\partial \dot q_{\gamma i}} \eta_i (t)\right]' - \left(\frac{d}{dt}\frac{\partial L}{\partial \dot q_{\gamma i}}\right) \eta_i (t)$$
y puesto que el término se desvanece en los extremos, nos encontramos con que
$$\frac{dS[\gamma]}{d\epsilon} = \int_A^B\sum_{i=1}^N\left[\frac{\partial L}{\partial q_{\gamma i}} - \frac{d}{dt}\frac{\partial L}{\partial \dot q_{\gamma i}}\right]\eta_i(t) dt $$
Debido a que esta cantidad debe desaparecer para cualquier conjunto independiente de las opciones de $\eta_i$, se deduce que el integrando debe desaparecer todas partes, y así
$$\frac{d}{dt}\frac{\partial L}{\partial \dot q_{\gamma i}} = \frac{\partial L}{\partial q_{\gamma i}}$$
Esto nos da la de Euler-Lagrange las ecuaciones que nos permiten resolver por el buen camino en términos de las coordenadas generalizadas $q_{\gamma i}$.
La especificación de una curva, que vincula a la generalización de las coordenadas de las velocidades generalizadas, que sucede a nivel de la acción, no en el nivel de la Lagrangiana. Tan lejos como $L$ le preocupa, $q(t)$ $\dot q(t)$ no tienen nada que ver el uno con el otro y pueden ser elegidas de forma totalmente independiente. Esa es la diferencia entre la alimentación de $L$ el número de $q(t)$ frente a la función de $q$.
El general Lagrange formalismo se desarrolla en un colector $j^1(E)$ con la estructura de un jet paquete construido a partir de un haz de fibras $E \to \mathbb R$.
En otras palabras $E$ a nivel local es el producto de $Q$ $\mathbb R$ donde $Q$ es un colector donde las configuraciones del sistema se describen en cada momento $t \in \mathbb R$.
$E$ está cubierto por coordenadas local parches $t, q^1,\ldots, q^n$ donde $t$ es el temporal de coordenadas sobre la base $\mathbb R$ de la fibra bundle $E \to \mathbb R$ $q^1,\ldots, q^n$ cubrir las fibras de $Q_t$ (diffeomorphic a $Q$).
El primer chorro de extensión de la $j^1(E)$ $\mathbb R$ agranda cada fibra de $Q_t$ mediante la adición de un factor adicional $\mathbb R^n$ cubierto por chorro de coordenadas, $\dot{q}^1,\ldots, \dot{q}^n$ independiente de la $q^1,\ldots, q^n$ pero tales que identifican a $\frac{dq^1}{dt}, \cdots, \frac{dq^n}{dt}$ tan pronto como un movimiento de $t \mapsto (t, q^1(t), \ldots, q^n(t))$ es dado. En otras palabras $(t, q^1, \ldots, q^n, \dot{q}^1,\ldots, \dot{q}^n)$ revisión de la cinética de estado del sistema en tiempo de $t$. Aquí la configuración y de la cinética del estado son totalmente independientes. Las fibras de $j^1(E)$ por lo tanto $2n$-dimensiones de los colectores $A_t$, el espacio de la cinética de los estados en tiempo de $t$, diffeomorphic a un canónica de la fibra $A$ cubierto por coordenadas locales $q^1, \ldots, q^n, \dot{q}^1,\ldots, \dot{q}^n$
En vista de esta estructura, el cambio de coordenadas locales y pasando a $t', q^{'1},\ldots, q^{'n}, \dot{q}^{'1},\ldots, \dot{q}^{'n}$ de las relaciones son $$t' = t+c\tag{1}$$ $$q'^k = q'^k(t, q^1,\ldots, q^n)\tag{2}$$ $$\dot{q}^{'k} = \frac{\partial q^{'k}}{\partial t} + \sum_{j=1}^n \frac{\partial q^{'k}}{\partial q^j} \dot{q}^j\tag{3}$$ y a la inversa relaciones tienen la misma estructura.
Usted ve que la tercera ecuación es compatible con la interpretación de $\dot{q}$ a medida que el tiempo derivado de la $q$. Esta interpretación es sólo formal, ya que la derivada no puede ser calculada cuando un punto de $a\in A_t$ tiene: para el cómputo de dicho derivado necesitaríamos una curva (una sección), pasando por $a$, no sólo a $a$ sí.
De Euler-Lagrange las ecuaciones son de primer orden ecuaciones inducida por una función escalar ${\cal L} : j^1(E) \to \mathbb R$ que, en todos los locales de gráfico determina una sección de $t \mapsto \gamma(t) \in j^1(E)$, en las coordenadas $$t \mapsto (t, q(t), \dot{q}(t))\:, $$ la solución, por $k=1,\ldots, n$, $$\frac{d}{dt} \frac{\partial {\cal L}}{\partial \dot{q}^k}- \frac{\partial \cal L}{\partial q^k}=0\:.$$ $$\frac{dq^k}{dt} = \dot{q}^k(t)\:.$$ Usted ver que $\dot{q}$ resultados a la hora de derivados de $q$ sólo a lo largo de las soluciones de la E-L ecuaciones, de lo contrario $q$ $\dot{q}$ son variables independientes.
AÑADE COMENTARIO. Por qué jet haces?
La idea general es encontrar una estructura matemática que codifica la idea de que
$q$ $\dot{q}$ son variables independientes y se convierten en dependiente ($\dot{q}$ es el tiempo derivado de la $q$) a lo largo de todas las soluciones de las ecuaciones de movimiento.
La primera idea es modelar el espacio de la cinética de estadísticas sobre la tangente paquete de espacio de configuración $TQ$ donde $Q$ está cubierto por Lagrange coordinar parches $q^1,\ldots q^n$. Aquí $\dot{q}^1, \ldots, \dot{q}^n$ son las componentes de los vectores de tangentes en $q^1,\ldots q^n$ (interpretado como vectores de tangentes a curvas a través de ese punto de parametrización por medio del tiempo de coordenadas).
Esta es bonito, pero, de esta manera, las transformaciones de coordenadas explícitamente dependiendo de la hora son matemáticamente antinatural, pero físicamente es necesario (creo que de Lagrange coordenadas de descanso con dos marcos de referencia diferentes uno de inercia y el otro no inercial).
Una manera de usar como el espacio-tiempo de la cinética de los estados el producto Cartesiano $A = \mathbb R \times TQ$ donde $\mathbb R$ es el eje temporal y ver admisible coordenadas en $A$ coordina $(t,q^1,\ldots, q^n, \dot{q}^1, \ldots, \dot{q}^n)$ donde $t\in \mathbb R$ $q^1,\ldots, q^n$ están las coordenadas de $Q$ $\dot{q}^1, \ldots, \dot{q}^n$ son las coordenadas en cada fibra de $TQ$. La coordenada $t$, en la física clásica se requiere para que coincida con el tiempo absoluto, y por lo tanto se fija sólo a una constante aditiva. Esto explica por qué hemos restringido los posibles cambios temporales coordinar a la escuela primaria (1).
Esta imagen puede ser implementado ya en el nivel de espacio de configuraciones, definiendo el espacio-tiempo de configuraciones como $E: =\mathbb R \times Q$.
En la práctica, esta construcción es eficaz, pero adolece de la ideológicos inconveniente de que cada cambio de coordenadas (1)-(3) puede usar una diferente realización de $E$ (e $A$) como un producto Cartesiano como es evidente forma de las reglas de transformación (2) (y (3)), mientras que no la selección natural existe en general.
Así que debe buscar una estructura que se parece a un producto Cartesiano (al menos localmente), pero su Cartesiano de descomposición no es canónica y se admite una adaptación atlas de cartas locales cuyas reglas de transformación se indica en (1)-(3).
El primer paso para eliminar un fijo producto Cartesiano estructura es, la restricción (1) y (2) sólo, asumiendo desde el principio de que el espacio-tiempo de configuraciones no es $\mathbb R \times Q$, pero de un colector que localmente se parece a ese producto sin la fijación de cualquier elección particular de esta descomposición.
Esta estructura existe y es bien conocido en matemáticas: es un haz de fibras $E \to \mathbb R$ con canónica de fibra diffeomorphic a $Q$. El atlas de las coordenadas locales adaptadas al conjunto de la estructura (con global preferida de coordenadas definido por una constante aditiva sobre la base $\mathbb R$) está hecha de cartas locales $t, q^1,\ldots, q^n$ transformar exactamente como en (1)-(2).
Queda para ampliar aún más esta estructura para abarcar la cinética de la información. El colector $A= j^1(E)$ es un muy buen candidato. No es nada sino $E$ con la adición de $n = \dim (Q)$ coordenadas $\dot{q}^1, \ldots \dot{q}^n$ a cada fibra por cada natural coordinar parche $t, q^1,\ldots, q^n$, con el requisito de que el cambio de coordenadas (3) es cierto. Esto es debido a que, en la definición de jet paquete, el punto de coordenadas debe ser interpretado como componentes de los vectores de tangentes de las secciones en $E$, es decir, los componentes de todos los posibles vectores de tangentes a curvas de $\mathbb R \ni t \mapsto (q^1(t), \ldots, q^n(t))$ pasa a través de cada punto de $E$.
Parte de la OP de la pregunta, parece ser una cuestión de semántica: Si una de Lagrange $$L(q^1,\ldots, q^n, v^1,\ldots, v^n,t)\tag{1}$$ has $n$ independent generalized position variables $p^1,\ldots, q^n$, i.e. the configuration space is $n$-dimensional, then the system is said to have $$ n grados de libertad, cf. por ejemplo, este Phys.SE post.
Esta terminología es a pesar del hecho de que las ecuaciones de Lagrange se $n$ 2º orden, junto ODAs y, por tanto, la completa solución de $2n$ integración de las constantes.
Otro problema es que las velocidades generalizadas $v^1, \ldots, v^n,$ son variables independientes en el Lagrangiano (1), pero son las variables dependientes en la acción $$S[q^1,\ldots, q^n; t_i,t_f]~:=~ \int_{t_i}^{t_f}\!\mathrm{d}t~ L(q^1,\ldots, q^n, \dot{q}^1,\ldots, \dot{q}^n,t),\tag{2}$$ Este es, por ejemplo, explica en este Phys.SE post.