En el conjunto microcanónico, se seleccionan todos los estados con una energía determinada $E$ . Suponga que obtiene $N$ estados con esa energía. Porque necesitas conservar energía, sólo los estados con tal energía pueden ser visitados por el sistema.
A esto se añade el "principio de indiferencia", según el cual el sistema pasa la misma cantidad de tiempo en cada estado, y se obtiene una distribución de probabilidad $$\rho \sim 1/N$$ Hasta aquí todo bien.
En cierto modo, el universo es un conjunto microcanónico, aunque bastante grande. La energía total se conserva. Sin embargo, ¿qué ocurre si tomamos un gran conjunto microcanónico con energía $E_0$ ¿Cortamos una pequeña parte del universo, dejamos que intercambie calor (y sólo calor) a temperatura constante con el universo y vemos qué pasa? Imaginemos que el sistema que hemos considerado tiene energía $E_1$ en su interior. El resto del universo tiene energía $E_2$ . Lo único que sabemos con certeza es que $$E_1+E_2=E_0$$ en todo momento, pero como el pequeño sistema puede intercambiar energía con el exterior, puede "tomar prestada" parte de la energía o puede ceder parte de su energía, de modo que $E_1$ y $E_2$ pueden cambiar (pero sólo manteniendo $E_0$ constante).
La restricción de que la energía total se conserva ahora sólo es válida para el universo, pero el pequeño espacio que estamos considerando puede cambiar su energía por intercambios con el universo. Así que puede fluctuar.
Puede, pero ¿lo hace? En principio podría ser que el sistema pequeño fuera una especie de micro-microcanónico: se mantiene a energía constante $E_1$ para que se cumpla el principio de indiferencia. Pero en el caso de que la energía fluctúe, la indiferencia ya no puede mantenerse, ya que habrá que favorecer los estados de baja energía. De ahí la forma de la distribución de probabilidad canónica que permite estados con distinta energía.
Así que ahora te preguntas, ¿puedo cuantificar esto? Básicamente se toma el global distribución de probabilidad. Se margina teniendo en cuenta sólo el pequeño subsistema que consideraste. Haces algunos cálculos suponiendo $E_1\ll E_2$ y hallar la distribución de Boltzmann teniendo en cuenta las fluctuaciones. Probablemente lo harás en detalle en tu curso. Un razonamiento similar vale para la Grancanónica donde puedes intercambiar partículas.
Resumiendo, lo que tiene de especial el conjunto canónico es que, al poder intercambiar energía con el exterior, puede poblar estados de mayor energía de la esperada tomando prestada energía del exterior, por lo que los estados ya no son indiferentes. La temperatura te da una medida de cuanto puedes fluctuar. Cada vez que permites al sistema variar algo (con algunas restricciones) obtienes un sistema diferente que (si lo permiten las restricciones) puede fluctuar y violar la "indiferencia" (o mejor dicho, necesitas "ponderar" la indiferencia con alguna variable extra)