Lo que me gusta acerca de este problema es que no impone ninguna restricción a la carinality $A$; su conclusión se une para algunos muy grandes conjuntos de hecho.
Supongamos $f$ no es surjective, y vamos a
$B = f(A) \tag 1$
ser la imagen de $A$ bajo $f$; desde
$f \circ f = f, \tag 2$
está claro que cada elemento de a$B$ se fija en virtud de $f$, para
$b \in B \Longrightarrow \exists c \in A, \; b = f(c) \Longrightarrow f(b) = f(f(c)) = f(c) = b; \tag 3$
además, para $c \in A$,
$f(c) = c \Longrightarrow c \in B; \tag 4$
por lo tanto $B$ es precisamente el conjunto de puntos fijos de $f$.
Hemos asumido $f$ no surjective; entonces por lo anterior hemos
$B \subsetneq A, \tag 5$
lo que implica
$\exists a \in A \setminus B; \tag 6$
si
$b = f(a) \in B, \tag 7$
entonces
$f(b) = f(f(a)) = f(a) = b; \tag 8$
tomamos nota de
$B \ni b \ne a \in A \setminus B, \tag 9$
lo que se contradice con el dado hipótesis de que la $f$ es un inyectiva mapa. Por lo tanto $f$ es de hecho surjective.