- En primer lugar, la densidad de probabilidad de que un sistema de un conjunto canónico se encuentre a una energía determinada (es decir, con respecto a una medida $dE$ ) no es la fórmula que has dado sino:
$$\rho(E) = \frac{\Omega(E)e^{-\beta E}}{\int_0^{+\infty}dE\:\Omega(E)e^{-\beta E}} = \frac{e^{S(E)/k_B}e^{-\beta E}}{Q}=\frac{e^{-\beta F(E)}}{Q}$$
vemos así que el weiht asociado a un estado energético dado está más relacionado con una energía libre $F(E)=E-TS(E)$ que simplemente la energía real.
Ahora, la densidad de probabilidad de estar en un microestado dado $\mu$ (con respecto a alguna medida del espacio de fases $d\mu$ ) para un sistema en contacto con un termostato es:
$$f(\mu) = \frac{e^{-\beta E(\mu)}}{\int d\mu\:e^{-\beta E(\mu)}}$$
- En segundo lugar, intentaré resumir un poco lo dicho por los demás pero en una situación general trabajando con probabilidades n lugar de densidades de probabilidad (no hay gran diferencia).
Es importante tener en cuenta que cuando un sistema está en contacto con un termostato a temperatura $T$ si de hecho tienes un sistema pequeño, digamos $1$ que interactúa con una grande, digamos $2$ . El conjunto puede considerarse como un sistema aislado de energía $E$ . En equilibrio termodinámico todos los microestados del sistema aislado son equi-probables y tienen una probabilidad:
$$p(\mu) \equiv \frac{1}{\sum_{E_1}\Omega_1(E_1)\Omega_2(E-E_1)} \tag{1}$$
Aquí se supone que $E=E_1+E_2$ . Esto sólo es cierto si no hay interacción de volumen entre el sistema $1$ y el sistema $2$ .
Ahora, la probabilidad para el sistema $1$ estar en algún microestado $\mu_1$ con energía $E_1(\mu_1)$ no es más que la suma de $(1)$ sobre todos los microestados posibles del sistema $2$ que garantizan que $E_1+E_2=E$ es decir:
$$p_1(\mu_1) \equiv \frac{\Omega_2(E-E_1(\mu_1))}{\sum_{E_1}\Omega_1(E_1)\Omega_2(E-E_1)} \tag{2}$$
Lo que ya vemos es que la degeneración de un microestado del sistema $1$ es el número total de microestados del sistema $2$ compatible con la restricción $E=E_1+E_2$ . Así pues, ya vemos que cuanto mayor sea $E_1(\mu_1)$ cuanto menor sea el peso asociado al microestado $\mu_1$ (si suponemos que el número de microestados es una función creciente de la energía).
Este resultado general puede hacerse cuantitativo en el caso de pequeñas $E_1$ y da el peso de Boltzmann:
$$p_1(\mu_1) \equiv \frac{e^{-\beta_2 E_1(\mu_1)}}{\sum_{E_1}\Omega_1(E_1)e^{-\beta_2 E_1}} \tag{3}$$
donde $\beta_2 = 1/k_B T_2$ nos dice cómo la degeneración $\Omega_2(E-E_1(\mu_1))$ disminuye con $E_1$ para pequeños $E_1$ .