De hecho, se encuentra en el Espacio Schwartz que es el espacio $$ \mathcal{S} := \left\{f: \mathbb{R} \to \mathbb{R} \,:\, \forall \alpha,\beta \in \mathbb{N}\, \sup_{x\in\mathbb{R}} \left|x^\alpha f^{(\beta)}(x)\right| < \infty \right\} $$ donde $f^{(n)}$ denota el $n$ -ésima derivada de $f$ . Esta definición parece un poco intimidatoria al principio, pero es fácil de entender. Una función $f$ se encuentra en $\mathcal{S}$ si decae rápidamente, es decir, más rápido de lo que crece cualquier polinomio (por tanto $x^nf(x)$ está acotada para todo n), y si lo mismo es cierto para toda derivada de $f$ .
Este espacio es cerrado bajo la transformada de Fourier, es decir, si $f \in S$ entonces también lo es la transformada de Fourier $\mathcal{F}(f)$ . Lo mismo ocurre con la transformada de Fourier inversa. El espacio de los $C^\infty$ es obviamente un subespacio de $\mathcal{S}$ de ahí su imagen bajo $\mathcal{F}$ es también un subespacio de $\mathcal{S}$ .
El problema de tu razonamiento es que estás pensando en límites puntuales. Bajo esos, $\mathcal{S}$ no está completa, por lo que saber algo sobre el límite no dice mucho sobre $\mathcal{S}$ . Existen topologías sobre $\mathcal{S}$ que lo convierten en un espacio completo, y bajo los que efectivamente no se puede aproximar la función escalón mediante funciones en $\mathcal{S}$ . El "truco" de esas topologías consiste básicamente en forzar la convergencia de todas las derivadas, lo que impide, por ejemplo, aproximar funciones discontinuas.