Deje $a < x < y < b$. Vamos a probar a $f(y)=f(x)$ demostrando $|f(y)-f(x)| < \epsilon(y-x)$ por cada $\epsilon>0$. Por lo tanto, fijar $\epsilon > 0$. Por la hipótesis sobre la desaparición de los derivados, para cada $t \in [x,y]$ hay $\delta_t > 0$ tal que para $|z-t|<\delta_t$, $|f(z)-f(t)|<\epsilon|z-t|$.
Ahora aquí es un poco menor truco: Los intervalos de $(t-\delta_t/2,t+\delta_t/2)$ (de radio $\delta_t/2$, en lugar de $\delta_t$) de la cubierta $[x,y]$. Por ahora decir que es un intervalo de la forma $(t-\delta_t/2,t+\delta_t/2)$ es un estrecho intervalo y uno de la forma $(t-\delta_t,t+\delta_t)$ es un amplio intervalo. Por compacidad existe un número finito de subcover por estrechos intervalos, centrado en decir $t_1,\dotsc,t_s$,$x \leq t_1 < t_2 < \dotsc < t_s \leq y$. Podemos reducir a un irredundante de la cubierta, es decir, para que no estrecho intervalo centrado en a $t_i$ está contenida en el estrecho intervalo centrado en a$t_j$$j \neq i$. Esto implica que para cada una de las $i$, los estrechos intervalos centrados en $t_i$ $t_{i+1}$ de solapamiento: de lo contrario, al menos un punto en la distancia entre ellos debe ser cubierto por el intervalo centrado en algunos de los $t_j$ $j<i$ o $j>i+1$; y cualquiera de las $t_i$ es redundante, o $t_{i+1}$ es redundante. Siguiente, esto implica que para cada $i$, $|t_{i+1}-t_i| < \max(\delta_{t_{i+1}},\delta_{t_i})$. En efecto, si un punto de $u$, $t_i < u < t_{i+1}$, se encuentra en la intersección de los estrechos intervalos, entonces
$$
t_{i+1}-t_i = t_{i+1}-u+u-t_i < \delta_{t_{i+1}}/2 + \delta_{t_i}/2 \leq 2 \max(\delta_{t_{i+1}}/2,\delta_{t_i}/2).
$$
De ello se sigue que para cada $i$, $t_{i+1}$ se encuentra en el amplio intervalo centrado en a $t_i$ o $t_i$ se encuentra en el amplio intervalo centrado en a $t_{i+1}$ (o ambos). En particular, para cada $i$, $|f(t_{i+1})-f(t_i)| < \epsilon |t_{i+1}-t_i|$.
Pretendemos que la misma relación se mantiene entre el$x$$t_1$, y entre el$y$$t_s$. De hecho, $x$ se encuentra en el estrecho intervalo centrado en a $t_1$, por lo tanto, también en el amplio intervalo. Por lo $|f(t_1)-f(x)| < \epsilon |t_1-x|$. Asimismo, para $y$$t_s$.
Poniendo todo junto, tenemos:
$$
\begin{split}
|f(y)-f(x)| &\leq |f(y)-f(t_s)| + |f(t_s)-f(t_{s-1})| + \dotsb + |f(t_1)-f(x)| \\
&< \epsilon|y-t_s| + \epsilon|t_s-t_{s-1}| + \dotsb + \epsilon|t_1-x| \\
&= \epsilon(y-t_s) + \epsilon(t_s-t_{s-1}) + \dotsb + \epsilon(t_1-x) \\
&= \epsilon(y-x),
\end{split}
$$
como se reivindica.
Notas: (1) Gracias por varios comentarios muy valiosos acerca de las simplificaciones, las lagunas en la prueba, etc! (2) me pregunto si la aplicación de un Primo del teorema podría simplificar el argumento.