Creo que para aclarar del todo lo que está pasando es mejor que resolvamos este problema desde cero; entonces quedará claro lo que está pasando. Supongamos que $y_0(t)$ es la trayectoria estacionaria (la trayectoria que minimiza $J[y]$ ) para $$J[y] = \int_{t_1}^{t_0}dt \sqrt{1+(\dot{y})^2}:= \int_{t_1}^{t_0}dt L(t,y,\dot{y}) $$ y $y(t) = y_0(t) +\epsilon\eta(t)$ es una variación tal que $\eta(t_0)=\eta(t_1) = 0$ . Entonces, asumiendo $\epsilon$ es pequeño $$ \sqrt{1+(\dot{y})^2} = \sqrt{1+(\dot{y}_0)^2 + 2\epsilon \dot{\eta}\dot{y}_0}= \sqrt{1+(\dot{y}_0)^2}\left(1+\frac{\epsilon \dot{\eta}\dot{y}_0}{1+(\dot{y}_0)^2}\right) $$ Por lo tanto, $$\delta J=J[y] - J[y_0] = \epsilon \int_{t_0}^{t_1} dt \frac{\dot{y}_0}{\sqrt{1+\dot{y}_0^2}}\dot{\eta}=-\epsilon \int_{t_0}^{t_1} dt \frac{d}{dt}\left[\frac{\dot{y}_0}{\sqrt{1+\dot{y}_0^2}}\right]\eta $$ La última parte es por integración por partes. Ahora la acción ( $J[y]$ ) es estacionario si $\delta J = 0$ para cualquier variación $\eta$ . Esto significa que $$\frac{d}{dt}\left[\frac{\dot{y}_0}{\sqrt{1+\dot{y}_0^2}}\right]=0$$ que resulta ser en realidad $\frac{d}{dt}(\partial L/\partial \dot{y})=0$ (La ecuación de Euler-Lagrange con $\partial L/\partial y=0$ ). Si volvemos a la demostración de la ecuación de Euler-Lagrange veremos que en ningún momento nos importa cómo $y$ depende en realidad de $t$ . En realidad, ese es el objetivo, ya que queremos explorar más todos los caminos posibles y encontrar el extremo. En ese sentido hay que tratar $y$ y $\dot{y}$ como variables independientes ya que en realidad no sabemos nada sobre su funcionalidad y ni siquiera queremos saberlo.
En otras palabras, al tratar los caminos como las variables $\dot{y}=\dot{y}_0+\epsilon \dot{\eta}$ , mientras que $y=y_0 + \epsilon \eta$ . Aunque es muy posible que $y_0$ y $\dot{y}_0$ están relacionados entre sí, ya que $\eta$ es completamente arbitraria, $y$ y $\dot{y}$ son independientes.