He aquí lo que, a mi juicio, una matemática y lógica precisa la presentación del teorema, hágamelo saber si esto le ayuda.
Matemática Preliminares
En primer lugar, permítanme presentarles a algunas notación precisa para no tener problemas con "infinitesimals", etc. Dado un campo $\phi$, vamos a $\hat\phi(\alpha, x)$ denotar un suave familia de un parámetro de campos en los que el $\hat \phi(0, x) = \phi(x)$. Llamamos a esta familia un flujo de $\phi$. Entonces podemos definir la variación de $\phi$ de este flujo como el primer orden de aproximación a la variación en $\phi$ como sigue:
Definición 1. (Variación de campo)
$$
\delta\phi(x) = \frac{\partial\hat\phi}{\parcial\alpha}(0,x)
$$
Esta definición implica entonces la siguiente expansión
$$
\hat\phi(\alpha, x) = \phi(x) + \alpha\delta\phi(x) + \mathcal O(\alpha^2)
$$
que hace contacto con la notación en muchos libros de física como Peskin y Schroeder.
Nota: En mi notación, $\delta\phi$ NO es un "infinitesimal", es el coeficiente del parámetro $\alpha$ en el primer cambio de orden en el campo bajo el flujo. Yo prefiero escribir las cosas de esta manera porque me parece que lleva a mucha menos confusión.
A continuación, vamos a definir la variación de la Lagrangiana bajo el flujo como el coeficiente de variación en $\mathcal L$ a primer orden en $\alpha$;
Definición 2. (Variación de la densidad Lagrangiana)
$$
\delta\mathcal L(\phi(x), \partial_\mu\phi(x)) = \frac{\partial}{\partial\alpha}\mathcal L(\hat\phi(\alpha, x), \partial_\mu\hat\phi(\alpha, x))\Big|_{\alpha=0}
$$
Dadas estas definiciones, se los dejo a ustedes para mostrar
Lema 1.
Para cualquier variación de los campos $\phi$, la variación de la densidad Lagrangiana satisface
\begin{align}
\delta\mathcal L
&= \left(\frac{\partial \mathcal L}{\partial\phi} - \partial_\mu\frac{\partial\mathcal L}{\partial(\partial_\mu\phi)}\right)\delta\phi + \partial_\mu K^\mu,\qquad K^\mu = \frac{\partial\mathcal L}{\partial(\partial_\mu\phi)}\delta\phi
\end{align}
Usted necesitará usar (1) la regla de La cadena para la diferenciación parcial, (2) el hecho de $\delta(\partial_\mu\phi) = \partial_\mu\delta\phi$ que puede ser probada a partir de la definición anterior de $\delta\phi$ y (3) el producto de la regla de diferenciación parcial.
El teorema de Noether en los pasos
Vamos a un determinado flujo de $\hat\phi(\alpha, x)$ ser dado.
Supongamos que para este flujo particular, existe cierta campo de vectores $J^\mu\neq K^\mu$ tal que
$$
\delta\mathcal L = \partial_\mu J^\mu
$$
Aviso, que para cualquier campo de $\phi$ que satisface la ecuación de movimiento, Lema 1 nos dice que
$$
\delta \mathcal L = \partial_\mu K^\mu
$$
Definir un campo de vectores $j^\mu$ por
$$
j^\mu = K^\mu - J^\mu
$$
Observe que para cualquier campo $\phi$ la satisfacción de las ecuaciones de movimiento de los pasos 2+ 3 + 4 implica
$$
\partial_\mu j^\mu = 0
$$
Q. E. D.
Notas Importantes!!! Si usted sigue la lógica cuidadosamente, verás que $\delta L = \partial_\mu K^\mu$ sólo a lo largo de las ecuaciones de movimiento. También, parte de la hipótesis del teorema fue que encontramos un $J^\mu$ que no es igual a $K^\mu$ que $\delta\mathcal L = \partial_\mu J^\mu$. Esto asegura que el $j^\mu$ definido en la final no es idéntica a cero! Con el fin de encontrar una $J^\mu$, usted no debe utilizar las ecuaciones de movimiento. Usted debe ser la aplicación de la dada de flujo para el campo y ver lo que pasa a primer orden en el "parámetro de flujo" $\alpha$.
Saludos!