Deje $y\in X$ ser arbitraria. Considerar la secuencia de $y_n = f^ {n}(y) = \underbrace{(f\circ \ldots \circ f)}_{n}(y)$ que consiste en la aplicación de la función de $n\geq 1$ veces hasta el punto de $y$. Desde $y_n \in f(X)$ por cada $n\geq 1$, e $f(X)$ es compacto (debido a $f$ es continuo), $(y_n)$ tiene un convergentes subsequence $y_{n_k} \to f(x_0)$, para algunas de las $x_0 \in X$. Observe que para $k\geq 1$,
$$
\varrho(f^{n_k - 1}(s),x_0) \leq \varrho(f^{n_k}(y),f(x_0)) \underbrace{\longrightarrow}_{k\to \infty} 0.
$$
Por lo tanto, $x_0$ es el límite de la secuencia de $(y_{n_k-1})_{k\in \mathbb{N}}$ (en $fX$), y $x_0 \in f(X)$. Escribimos $x_0 = f(x_1)$$x_1\in X$. Con el mismo razonamiento, podemos probar a $x_1$ es el límite de la secuencia de $(y_{n_k-2})_{k\in \mathbb{N}}$, lo que significa que $x_1\in f(X)$, y escribimos $x_1 = f(x_2)$. Procediendo de esta manera, obtenemos una secuencia $(x_n)_{n\geq 0}$ $f(X)$ tal que $f(x_n)=x_{n-1}$ todos los $n\geq 1$ que $y_{n_k-n+1} \to x_n$ (para $k$). Entonces, para $k\geq 1$,
$$
\varrho(y,x_{n_k-1}) \leq \varrho(fy,x_{n_k-2}) \leq \ldots \leq \varrho(f^{n_k}(y),x_0).
$$
Podemos entonces concluir que el $y=\lim_{k\to \infty}x_{n_k - 1}$, lo que significa que $y\in f(X)$.