En el fondo esto es realmente trivial, una consecuencia de $\rm\ f(x) = x^p\ \Rightarrow\ f{\:'}(x)\ =\ p\, x^{p-1} \equiv\ 0\:\ (mod\ p).\ $ Primero doy una demostración sencilla, luego explico el punto de vista en términos de derivadas y raíces múltiples.
$\rm mod\ p\!:\,\ 0 \equiv a^p - b^p \equiv a-b,\:$ así que $\rm\:p\mid a-b.\, $ Así que para mostrar $\rm\ p^2\:|\:a^p\!-b^p = (a-b)\frac{a^p-b^p}{a-b}\,$ basta
$\rm to\ show\ that\ \ p\:|\:a-b\ \Rightarrow\ p\ \,\Big|\frac{a^p-b^p}{a-b}\: =\ a^{p-1}+a^{p-2}\:b+\:\cdots\:+a\:b^{p-2}+b^{n-1}$
$\rm But\ \ \ \ \ \ \ mod\,\ p\!: \ a\equiv b\ \ \ \Rightarrow\ \ \ \frac{a^p-b^p}{a-b}\ \equiv\ a^{p-1}+\:\cdots\:+a^{p-1} \equiv\, p\, a^{p-1}\equiv\, 0\quad $ QED
La línea anterior es el caso especial $\rm\ f = x^p,\ x = b\ $ de este aproximante polinómico en serie de Taylor:
$\rm\displaystyle\quad\quad\quad\quad\quad \frac{f(x)-f(a)}{x-a} \: \equiv\ f\:'(a)\ \ \ (mod\ \:x-a)\quad$ para $\rm\ f(x)\in \mathbb Z[x]$
$\qquad $ es decir $\rm\quad\ f(x)\ =\ f(a) +\: f\:'(a)\ (x-a) \:+\: (x-a)^2\: g(x)\quad$ para algunos $\rm\ g(x) \in \mathbb Z[x]$
Por lo tanto, este resultado sobre números no es más que un caso especial del siguiente resultado bien conocido sobre funciones (aquí polinomios): $ $ una raíz $\rm\ x = a\ $ de $\rm\ f(x)\ $ tiene multiplicidad $\rm > 1\ \iff\ f\:'(a) \:=\: 0.\:$ De hecho, como en el caso anterior, muchos resultados sobre números son en realidad especializaciones de resultados sobre funciones. Además, como las funciones tienen una estructura más rica que los números -por ejemplo, disponen de derivadas-, podemos explotar esta estructura en el ámbito de las funciones antes de especializarnos en los números. Un buen ejemplo de ello es el teorema ABC de Mason, que tiene una demostración trivial a nivel de bachillerato para los polinomios, pero es una conjetura no demostrada para los números. Como consecuencia, se obtiene una demostración trivial de la FLT para polinomios. La moraleja es: para demostrar un resultado sobre números, intente interpretarlo como un caso especial de un resultado sobre funciones.