Lo que sigue es una combinación de una demostración en el libro "Principios del análisis matemático" de Dieudonné de una versión del teorema del valor medio y de la demostración del Teorema (Teorema 8.21) en el libro de Rudin de Rudin "Análisis Real y Funcional" que usted también cita.
En realidad, la prueba arroja la afirmación más contundente de que basta con que $f$ es diferenciable desde la derecha en $\left[a,b\right]$ excepto para un conjunto (a lo sumo) contable $\left\{ x_{n}\mid n\in\mathbb{N}\right\} \subset\left[a,b\right]$ .
Sea $\varepsilon>0$ sea arbitraria. Como en la prueba de Rudin, hay un función semicontinua inferior $g:\left[a,b\right]\to\left(-\infty,\infty\right]$ tal que $g>f'$ y $$ \int_{a}^{b}g\left(t\right)\, dt<\int_{a}^{b}f'\left(t\right)\, dt+\varepsilon. $$ Sea $\eta>0$ ser arbitraria. Defina \begin{eqnarray*} F_{\eta}\left(x\right) & := & \int_{a}^{x}g\left(t\right)\, dt-f\left(x\right)+f\left(a\right)+\eta\left(x-a\right),\\ G_{\eta}\left(x\right) & := & F_{\eta}\left(x\right)+\varepsilon\cdot\sum_{\substack{n\in\mathbb{N}\\ x_{n}<x } }2^{-n}. \end{eqnarray*} Con estas definiciones, $F_{\eta}$ es continua con $F_{\eta}\left(a\right)=0=G_{\eta}\left(a\right)$ .
Además, si $z_{n}\uparrow z$ entonces $F_{\eta}\left(z_{n}\right)\to F_{\eta}\left(z\right)$ y $$ \varepsilon\cdot\sum_{\substack{m\in\mathbb{N}\\ x_{m}<z_{n} } }2^{-m}\leq\varepsilon\cdot\sum_{\substack{m\in\mathbb{N}\\ x_{m}<z } }2^{-m}, $$ que da como resultado $$ \limsup_{n\to\infty}G_{\eta}\left(z_{n}\right)\leq G_{\eta}\left(z\right).\qquad\left(\dagger\right) $$
Para $x\in\left[a,b\right)$ hay dos casos:
-
$x=x_{n}$ para algunos $n\in\mathbb{N}$ . Por continuidad de $F_{\eta}$ , hay algún $\delta_{x}>0$ tal que $F_{\eta}\left(t\right)>F_{\eta}\left(x\right)-\varepsilon\cdot2^{-n}$ es válido para $t\in\left(x,x+\delta_{x}\right)$ . Para aquellos $t$ , obtenemos \begin{eqnarray*} G_{\eta}\left(t\right)-G_{\eta}\left(x\right) & = & F_{\eta}\left(t\right)-F_{\eta}\left(x\right)+\varepsilon\cdot\sum_{\substack{m\in\mathbb{N}\\ x\leq x_{m}<t } }2^{-m}\\ & > & -\varepsilon\cdot2^{-n}+\varepsilon\cdot\sum_{\substack{m\in\mathbb{N}\\ x\leq x_{m}<t } }2^{-m}\geq0. \end{eqnarray*}
-
$x\notin\left\{ x_{n}\mid n\in\mathbb{N}\right\} $ . Por supuesto, esto implica que $f$ es diferenciable por la derecha en $x$ que significa $$ \frac{f\left(t\right)-f\left(x\right)}{t-x}\xrightarrow[t\downarrow x]{}f'\left(x\right)<f'\left(x\right)+\eta. $$ Junto con $g\left(x\right)>f'\left(x\right)$ y con el inferior semicontinuidad de $g$ vemos que hay $\delta_{x}>0$ tal que $$ f\left(t\right)-f\left(x\right)<\left(f'\left(x\right)+\eta\right)\cdot\left(t-x\right)\text{ and }g\left(t\right)>f'\left(x\right)\qquad\forall t\in\left(x,x+\delta_{x}\right). $$ Por lo tanto, para cada $t\in\left(x,x+\delta_{x}\right)$ obtenemos \begin{eqnarray*} G_{\eta}\left(t\right)-G_{\eta}\left(x\right) & = & \varepsilon\cdot\sum_{\substack{m\in\mathbb{N}\\ x\leq x_{m}<t } }2^{-m}+F_{\eta}\left(t\right)-F_{\eta}\left(x\right)\\ & \geq & F_{\eta}\left(t\right)-F_{\eta}\left(x\right)\\ & = & \int_{x}^{t}\underbrace{g\left(s\right)}_{>f'\left(x\right)}\, ds-\left[f\left(t\right)-f\left(x\right)\right]+\eta\left(t-x\right)\\ & > & f'\left(x\right)\cdot\left(t-x\right)-\left[f'\left(x\right)+\eta\right]\left(t-x\right)+\eta\left(t-x\right)=0. \end{eqnarray*}
En resumen, para cada $x\in\left[a,b\right)$ hay algo de $\delta_{x}>0$ tal que $G_{\eta}\left(t\right)>G_{\eta}\left(x\right)$ para todos $x\in\left(x,x+\delta_{x}\right)$ . Utilización de $G_{\eta}\left(a\right)=0$ , vemos $G_{\eta}\left(t\right)\geq0$ para $t\in\left[a,a+\delta_{a}\right)$ . Defina $$ \varrho:=\sup\left\{ t\in\left(a,b\right)\mid G_{\eta}|_{\left[a,t\right)}\geq0\right\} . $$ Es fácil ver que realmente se alcanza el supremum. Utilizando $\left(\dagger\right)$ , también vemos $G_{\eta}|_{\left[a,\varrho\right]}\geq0$ .
Si tuviéramos $\varrho<b$ lo anterior daría como resultado $G_{\eta}\geq0$ en $\left[a,\varrho\right]\cup\left(\varrho,\varrho+\delta_{\varrho}\right)=\left[a,\varrho+\delta_{\varrho}\right)$ , en contradicción con la maximalidad de $\varrho$ . Por lo tanto, $\varrho=b$ que da como resultado \begin{eqnarray*} 0 & \leq & G_{\eta}\left(b\right)\\ & = & \varepsilon\cdot\sum_{\substack{m\in\mathbb{N}\\ x_{m}<b } }2^{-m}+\int_{a}^{b}g\left(t\right)\, dt-f\left(b\right)+f\left(a\right)+\eta\left(b-a\right)\\ & \leq & \varepsilon+\int_{a}^{b}f'\left(t\right)\, dt+\varepsilon-f\left(b\right)+f\left(a\right)+\eta\left(b-a\right). \end{eqnarray*} Dejar $\varepsilon\to0$ y luego $\eta\to0$ concluimos $$ f\left(b\right)-f\left(a\right)\leq\int_{a}^{b}f'\left(t\right)\, dt. $$ Aplique ahora el argumento anterior a $-f$ en lugar de $f$ (tenga en cuenta que $-f$ cumple todos los supuestos). El resultado es $$ f\left(b\right)-f\left(a\right)\geq\int_{a}^{b}f'\left(t\right)\, dt $$ y por lo tanto $$ \int_{a}^{b}f'\left(t\right)\, dt=f\left(b\right)-f\left(a\right). $$ Es evidente que con el mismo argumento se obtiene $$ f\left(y\right)-f\left(x\right)=\int_{x}^{y}f'\left(t\right)\, dt $$ para todos $x,y\in\left[a,b\right]$ .