f \mapsto \mu_n(f) = \frac{1}{n}\sum_{i=1}^n f(x_i) es una medida de probabilidad. Así que tienes una secuencia de medidas de probabilidad (\mu_n) y queremos demostrar que tiene una subsecuencia convergente (convergencia en la topología débil). Tomemos (f_l) una densa familia en C[0,1] .
Comience con l=1 .
La secuencia (\mu_n(f_1))_{n\in \mathbb{N}} está limitada en valor absoluto por ||f_1|| por lo que tiene una subsecuencia convergente indexada por \mathbb{N}_1 \subset \mathbb{N} .
La secuencia (\mu_n(f_2))_{n\in \mathbb{N}_1} está limitada por ||f_2|| por lo que tiene una subsecuencia convergente indexada por \mathbb{N}_2 \subset \mathbb{N}_1 .
La secuencia (\mu_n(f_3))_{n\in \mathbb{N}_2} está limitada por ||f_3|| por lo que tiene una subsecuencia convergente indexada por \mathbb{N}_3 \subset \mathbb{N}_2 .
\ldots
y así sucesivamente. Obtenemos una secuencia de subconjuntos infinitos de \mathbb{N} \mathbb{N} \supset \mathbb{N}_1 \supset \mathbb{N}_2 \supset \ldots con la propiedad de que \mu_n(f_l)_{n\in \mathbb{N}_l} es convergente.
Ahora existe \tilde{ \mathbb{N}} un subconjunto infinito de \mathbb{N} con la propiedad de que \tilde{ \mathbb{N}} \backslash \mathbb{N}_l es finito para todo l\ge 1 . (así que para todos l , \tilde{ \mathbb{N}} \subset \mathbb{N}_l excepto para un número finito de elementos). Una forma de construir \tilde{ \mathbb{N}} es la siguiente: en el paso l añadir al conjunto el elemento más pequeño de \mathbb{N}_l que no fue elegido antes (argumento de la diagonal de Cantor).
De lo anterior se deduce que
\mu_n(f_l)_{n\in \tilde{ \mathbb{N}}}
es convergente para todo l .
Utilizando la densidad de (f_l)_l es fácil demostrar que para cada f \in C[0,1] la secuencia \mu_n(f)_{n\in \tilde{ \mathbb{N}}} es convergente ( demuestre que es Cauchy).
Definir
\mu(f)\colon =\lim_{n\in \tilde{ \mathbb{N}}} \mu_n(f)
una función lineal positiva sobre C[0,1] . Ahora utiliza el teorema de Riesz.