Como físico teórico que se pasó a las matemáticas puras, creo que para responder a esta pregunta y como aclaración a posts anteriores, no debemos olvidar el lado histórico de la evolución y los orígenes de los términos implicados en la modelización de la teoría física.
El origen del principio de acción estacionaria ("mínima" la mayor parte del tiempo) viene como una formulación variacional que utiliza un funcional $S[q(t)]:=\int_{t_1}^{t_2}L(q^i (t),\dot{q}^i (t);t)dt$ para las ecuaciones de Lagrange del movimiento real de un sistema con coordenadas generalizadas $q^i (t)$ (obtenidas de esta forma se denominan ecuaciones de Euler-Lagrange): $$\delta S[q_{real}(t)]=0\Rightarrow \frac{d}{dt}\frac{\partial L}{\partial \dot{q}^i}-\frac{\partial L}{\partial q^i}=0$$
Las ecuaciones de movimiento originales de Lagrange se obtuvieron como una reformulación de la segunda ley de la mecánica de Newton para el caso de coordenadas generalizadas (los grados de libertad restantes tras introducir las restricciones) como una versión más fácil de manejar del principio de D'Alembert. D'Alembert escribió el principio del "trabajo virtual" como una forma de enunciar una ecuación general para la estática, que en cierto modo equivale a postular que las fuerzas de restricción no ejercen trabajo (ya que deberían ser internas y se aplica la 3ª ley débil). Ahora bien, dada la segunda ley de Newton para un sistema de partículas, D'Alembert reformula la dinámica constreñida como estática introduciendo la fuerza de inercia (puedes ver los detalles en wikipedia ) $$\sum_i (\vec{F}_{i}^{ext}-\frac{d\vec{p}_i}{dt})\cdot\delta \vec{r_i}=0$$
Lagrange quería trabajar sólo con coordenadas generalizadas que el cambio de variables en el principio de D'Alembert le llevó a las ecuaciones de movimiento originales de Lagrange en términos de una energía cinética generalizada $T$ y fuerzas generalizadas $Q_i$ ; además absorbió aquellas fuerzas conservadoras que derivaban de un potencial $Q_i^c=-\partial U/\partial q_i$ (o más generalmente las que incluso dependían de la velocidad o del tiempo pero tenían la forma requerida del lado izquierdo) junto con la energía cinética, en una función $L=T-U$ ahora llamado el Lagrangiano $$\frac{d}{dt}\frac{\partial T}{\partial \dot{q}^i}-\frac{\partial T}{\partial q^i}=Q_i\Rightarrow \frac{d}{dt}\frac{\partial L}{\partial \dot{q}^i}-\frac{\partial L}{\partial q^i}=Q_i^{no-c.}$$
Este es el origen de la forma del lagrangiano como $L=T-U$ . Ahora, las fuerzas no conservativas $Q_i^{no-c.}$ aparecen porque estamos considerando "sistemas abiertos" generales que intercambian energía con su entorno, otros sistemas como fuentes de energía, etc. Para comprobar esta forma en detalle, considere primero que un sistema cerrado es siempre de la forma $L=T-U$ debido a un razonamiento constructivo como el siguiente. Para una partícula libre, al menos localmente, debido a la homogeneidad del espacio y del tiempo, y a la isotropía del espacio, debemos tener $L(q_i,\dot{q}_i;t)=T(v^2)$ es decir, un escalar que sólo depende de la partícula y de su velocidad (pero no de su dirección); puesto que una partícula libre debe seguir siéndolo en otro sistema inercial por definición, la relación debe ser lineal $L=a\cdot v^2$ (esto se debe a que cualquier otro Lagrangiano que dé las mismas ecuaciones de movimiento tiene que ser de la forma $L'=A\cdot L+\frac{d}{dt}\Omega(q;t)$ para la que una transformación inercial $\vec{v}'=\vec{v}-\vec{\epsilon}$ debe implicar en primer orden $-2\vec{v}\cdot\vec{\epsilon}\partial L(v^2)/\partial (v^2)\propto d\Omega(q;t)/dt\Leftrightarrow \partial L/\partial (v^2)=0$ ); ahora la constante $a$ caracteriza a la partícula, y debe reducirse a la segunda ley newtoniana libre ( $p_i=m\cdot v_i =0$ ) por lo tanto $a=m/2$ . Para un sistema de partículas libres sin interacciones se aplica lo mismo sumando las energías cinéticas individuales $L_{free}=T=\frac{1}{2}\sum_i m_i v_i^2=\frac{1}{2}\sum_{i,j} A_{ij}\dot{q}^i\dot{q}^j$ (cuando $T$ es una forma cuadrática el sistema se denomina "natural", lo que ocurre cuando $\partial \vec{r}_k(q^i(t),\dot{q}^i(t);t)/\partial t = 0$ para todas las partículas $k$ común para el caso natural de las restricciones que no dependen del tiempo). Para añadir interacciones entre partículas en un sistema cerrado, sus grados de libertad deben estar acoplados, lo que sólo significa que las energías relativas no se pierden en el exterior, y esto se implementa satisfactoriamente mediante una función potencial $U=U(q_i,\dot{q}_i)$ . Mediante este método obtenemos un marco general para la mecánica que utiliza las ecuaciones de Lagrange: postulando diferentes potenciales obtenemos diferentes modelos de interacciones que se contrastarán con la experimentación para constreñir la forma de $U$ (esto puede hacerse para obtener sólo modelos fenomenológicos efectivos, sin embargo todas las interacciones fundamentales de la física parecen encajar muy bien en este marco). Finalmente, cuando la parte B del sistema A+B está fija (como considerada externa) su movimiento puede tratarse como ya 'resuelto', lo que abre el sistema cerrado anterior, separando algunos de los grados de libertad $q_B^i(t)$ por lo que el Lagrangiano desacopla $L_{open}=T_A+T_B(\dot{q}^i_B(t))-U(q_A,q_B(t),\dot{q}_A,\dot{q}_B(t))$ en este caso $T_B=d\Omega(q_B,t)/dt$ para algunos $\Omega$ por lo que podemos despreciar esa parte ya que no contribuye a las ecuaciones de movimiento y por tanto $L_{open}=T_A-U_{open}(q_A,\dot{q}_A,t)$ . De este modo $U$ crea el efecto de fuerzas no conservativas que no son más que aquellas que añaden o restan energía al sistema sin tener en cuenta a dónde va esta energía.
Por lo tanto, podemos considerar la ecuación de Lagrange (sin fuerzas no conservativas) como la ecuación general más fundamental dadas las interacciones individuales entre las partículas del Universo, al menos en principio. Por eso la forma $L=T-U$ es el enfoque habitual en física teórica para tratar la dinámica, ya que el propio concepto de fuerza instantánea a distancia à-la Newton es antinatural (sobre todo después de la relatividad especial-general) y el enfoque local energético no sólo es matemáticamente mejor sino filosóficamente más satisfactorio. El sitio Enfoque hamiltoniano puede tomarse también como punto de partida, o como una transformación de Legendre de la dinámica de Lagrange, pero así se hace una descomposición no relativista de las coordenadas $x^i, t$ que es útil para la mecánica cuántica no relativista.
Ahora bien, en general, la física es una teoría de campos, por lo que queremos añadir éstos al marco. Esto se hace fácilmente considerándolos como sistemas continuos de grados de libertad, proporcionando generalizaciones de las energías cinética y potencial de aquellos.
Además se desea una teoría invariante relativista (especial o general) que fuerce la $Ldt$ sea un escalar de Lorentz para obtener la covariante de Lorentz ( $SO(3,1)$ ) (es decir, covariantes como ecuaciones tensoriales en una variedad pseudo-riemanniana). De esta forma el caso libre razonado anteriormente nos lleva a $ds=Ldt$ (donde $ds$ es el intervalo espacio-temporal relativista o "tiempo propio" medido por la partícula) que efectivamente se reduce a $ds\approx \frac{1}{2}mv^2$ para velocidades $v\ll c$ y, por tanto, puede considerarse una generalización relativista del marco. No obstante, las partículas puntuales son idealizaciones, y tanto la teoría clásica como la cuántica requieren un tratamiento teórico de campos de la materia (en el caso clásico, las partículas aparecen como pequeños grumos de densidad, y en el caso cuántico el comportamiento de las partículas surge de niveles de energía discretos de los estados cuánticos de campo). En el artículo de wikipedia sobre Lagrangianos Se pueden ver diferentes ejemplos, desde partículas puntuales hasta campos, sus términos cinéticos, etc.
En cualquier caso, la forma tradicional $L=T-U$ tiene sus raíces en la propia naturaleza de la mecánica y cualquier teoría de campo moderna se crea construyendo posibles $T-U$ funcionales de los grados de libertad del campo, es decir, los campos $\phi_a(x^\mu)$ y sus "velocidades" $\partial \phi_a/\partial x^\nu$ (por razones de invariancia relativista velocidad similar al tiempo $\frac{\partial}{\partial t}$ no es suficiente y todo el $\partial_\nu$ ). De ahí que se construyan términos cinéticos como (convención de suma de Einstein) $T_\phi=\frac{1}{2}\partial_\mu\phi_a\partial^\mu\phi_a$ para campos escalares o $T_A=F_{\mu\nu}F^{\mu\nu}$ para campos vectoriales ( $F_{\mu\nu}:=\partial_\mu A_\nu-\partial_\nu A_\mu$ es en este caso el tensor construido a partir del campo utilizado para definir su energía cinética porque queremos construir invariantes "similares a la velocidad". $\partial_\mu$ escalares que también son invariantes Gauge, que es otra simetría física requerida típicamente además de Lorentz; además, requiriendo invariancia gauge para diferentes grupos de Lie, tyipcally $SU(N)$ , se fuerza la aparición automática de campos y acoplamientos entre los campos de materia responsables de las interacciones, lo que no es más que trabajar con conexiones y curvaturas de haces de fibras). Dado que cualquier término que hace que la ecuación de campo de movimiento no sea homogénea se considera una fuente de perturbación, o fuerza, uno ve los acoplamientos correspondientes en el Lagrangiano como una energía potencial, dando como siempre $\mathcal{L}=T_\phi+T_A-U(A_\mu,\phi)$ . Con esto, se deducen las ecuaciones físicas acopladas del movimiento para el principio de acción estacionario, donde ahora la integración debe ser sobre todo el espacio y un intervalo de tiempo (es decir. $\mathcal{L}$ es una densidad), las ecuaciones de movimiento de Euler-Lagrange del campo: $$\partial_\mu\frac{\partial\mathcal{L}}{\partial (\partial_\mu\phi)}-\frac{\partial\mathcal{L}}{\partial\phi}=0$$
Finalmente estas ecuaciones dan las soluciones de movimiento, es decir, las configuraciones de campo real en cualquier punto del espacio-tiempo, que son las que más contribuyen en un marco teórico-cuántico, donde se ponderan las amplitudes de transición complejas mediante Métodos operativos de Feynman utilizando la acción para cada configuración de campo posible ("movimiento"): $e^{\frac{i}{\hbar}S[\phi,A_\mu]}$ . Como se ha señalado en otro comentario, la aproximación semiclásica $\hbar\rightarrow 0$ hace que la solución clásica de Euler-Lagrange sea la predominante, deduciéndose así el principio de acción estacionaria. (Además, en la mecánica cuántica hamiltoniana no relativista, el teorema de Ehrenfest proporciona una ecuación de movimiento clásica similar a la de Newton para los grados de libertad medios).
De hecho, a medida que la ciencia avanza debemos ver las teorías y modelos anteriores como casos límite de nuevas teorías más precisas, pero al principio cualquier teoría física debe construirse mediante la intuición, la perspicacia y la comparación permanente con el experimento. Aunque Feynman tituló así su tesis, no desarrolla su aproximación a la teoría cuántica partiendo del principio de acción, al contrario, trabaja con la mecánica cuántica estándar (hamiltoniana) y obtiene un método novedoso para computar amplitudes de probabilidad cuántica en las que aparece la acción clásica. Se podría partir de la mecánica cuántica como sistema axiomático, desarrollar la aproximación de Feynman a los propagadores cuánticos del movimiento y deducir que las soluciones clásicas aproximadas del movimiento deben obedecer, en primer orden de correcciones cuánticas, a las ecuaciones clásicas de movimiento de Euler-Lagrange. Al mismo tiempo, se necesita la aportación de la mecánica clásica experimentalmente exitosa para llegar a la mecánica cuántica... y así sucesivamente. Al final en cualquier momento de la historia de la ciencia vamos consiguiendo cada vez mejores estructuras matemáticas que modelizan la realidad con distintos grados de precisión; lo importante es que una nueva debe contener a una antigua como aproximación en algún régimen, y explicar aún más. De esta forma, la física teórica tiende a conseguir mejores estructuras para abarcar más fenómenos de la Naturaleza de forma cada vez más sencilla, ya que explica más leyes efectivas con menos teorías (actualmente casi todos los fenómenos observados se explican por la relatividad general y la teoría cuántica de campos, y unificar ambas es la búsqueda interminable del santo grial de la física).