Solo voy a hacer un punto básico, por lo que pido disculpas si esto es completamente obvio para ti (también está contenido en la respuesta mucho más detallada de Igor Khavkine).
Sea $Q$ la variedad de configuración del sistema. El haz cotangente correspondiente $T^*Q$ tiene una forma simpléctica intrínseca $\omega=-d\Theta$, donde $\Theta$ es la forma uno tautológica en $T^*Q$. Para un Hamiltoniano $H:T^*Q\rightarrow \mathbb{R}$, las ecuaciones de Hamilton pueden expresarse en términos del campo vectorial de Hamilton $X_H$ (definido por $i_{X_H}\omega=dH$). Nótese que $\omega$ es intrínseco al espacio de fases $T^*Q$ y no depende del Hamiltoniano $H.
Ahora, dado un Lagrangiano $L:TQ\rightarrow\mathbb{R}$ y la correspondiente transformación de Legendre $\mathbb{F}L:TQ\rightarrow T^*Q$, y asumiendo aquí por simplicidad que $\mathbb{F}L$ es un difeomorfismo ("L es hiperregular"), se puede utilizar $\mathbb{F}L$ para devolver todo a $TQ$. $TQ$ se convierte en una variedad simpléctica, con forma simpléctica $\omega_L=(\mathbb{F}L)^*\omega$, y las ecuaciones de Euler-Lagrange son simplemente las ecuaciones para el flujo del campo vectorial de Hamilton $X_E$ definido por $i_{X_E}\omega_L = dE$, donde $E=(\mathbb{F}L)^*H = H\circ\mathbb{F}L$ es la función de energía en $TQ$. Supongo que el punto principal es que $TQ$ no es intrínsecamente una variedad simpléctica. La forma simpléctica $\omega_L$ también depende de la elección del Lagrangiano. Esta es una posible respuesta a por qué la formulación geométrica es más común en el lado hamiltoniano y parece estar `oculta' en el lado lagrangiano: la geometría de $TQ$ (en lo que respecta a las ecuaciones E-L) está relacionada con el Lagrangiano particular $L$, mientras que la geometría de $T^*Q$ es independiente del hamiltoniano particular $H`.
También recomendaría cualquiera de los libros de Jerry Marsden mencionados en la respuesta de Spiro Karigiannis como el mejor lugar para aprender esto (mi notación es consistente con la suya).
Editar: Debo aclarar que por 'transformada de Legendre' arriba me refiero (en coordenadas) al mapa $p_i(x, \dot{x}) = \frac{\partial L}{\partial \dot{x}^i}(x, \dot{x})$. Esto es estándar en la literatura, pero difiere del significado clásico $H(x, p) = p\dot{x}-L(x, \dot{x})` (donde $p_i = \frac{\partial L}{\partial \dot{x}^i}$).