De hecho, es una aproximación, en particular, una aproximación que es generalmente bueno a temperaturas suficientemente altas.
Para $N$ distinguibles, que no interactúan las partículas de la función de partición es $Z(\mathrm{dist.}) = {Z_0}^N$ donde $Z_0$ es el de una sola partícula función de partición. Si el $N$ de las partículas son todos en diferentes estados cuánticos, a continuación, hay $N!$ microstates de distinguible partículas que corresponden todos a la misma microestado de partículas indistinguibles. Sin embargo, si las partículas no son todos en diferentes estados, a continuación, el número de microstates de partículas distinguibles correspondiente a la misma microestado de distinguir las partículas es menor que $N!$.
Así que, en general, la relación entre la suma de más de microstates para distinguir las partículas y para indistinguibles de las partículas es bastante complejo. Sin embargo, si la temperatura es suficientemente alta, entonces (para la mayoría de los sistemas) el número de estados cuánticos accesibles será mucho mayor que el número de partículas, por lo que es poco probable que más de una partícula que va a ocupar el mismo estado cuántico. En este caso se puede hacer la aproximación de que la función de partición para distinguir las partículas es sólo $N!$ veces que para partículas indistinguibles. I. e. $Z(\mathrm{indist.}) = {Z_0}^N/N!$ como lo escribió.
La afirmación de que a temperaturas suficientemente altas, el número de estados cuánticos accesibles será mucho mayor que el número de partículas no es cierto para todos los sistemas, por ejemplo, es falso que para aquellos con delimitada espectro de energía (tales como el ideal paramagnet o el ejemplo de la OP da). También, ¿qué altura la temperatura debe ser depende del sistema. Para un gas ideal a la atmosférica densidades es una buena aproximación para temperaturas muy por encima de 1K.
Lo anterior es cierto para las partículas cuánticas (Fermiones o Bosones). En el límite clásico de la energía cuántica a nivel de separación es llevado a cero y el espectro se vuelve continua. Para un espectro continuo de la probabilidad de que dos partículas están exactamente en el mismo estado es cero, y por lo que la aproximación se convierte en exacta en este límite. Tenga en cuenta sin embargo, que no hay tal cosa como un clásico sistema de dos niveles, como el ejemplo dado por el OP. Un sistema clásico con dos mínimos locales en algunos casos puede ser tratada como un dos a nivel de sistema, pero esto en sí es una aproximación.