Estoy haciendo mi primer curso de mecánica estadística, un punto que no entiendo bien es la justificación de ignorar las derivadas de orden superior de la entropía con respecto a la energía.
Comenzamos el curso postulando la distribución microcanónica utilizando el principio de igualdad de probabilidades a priori para los microestados de un sistema aislado en equilibrio y luego llegamos a la distribución canónica por reconocimiento,
\begin{equation} P_r \propto \mathcal{N_{env}}(E_{total} - E_r) \end{equation}
Dónde,
$r\, :$ microestado del sistema que interactúa con un entorno a temperatura T (sólo permite el intercambio de energía).
$E_{r}\, :$ Energía asociada al microestado del sistema.
$\mathcal{N_{env}}(E_{total} - E_r) :$ Número de microestados del entorno que satisfacen la restricción $E_{total} = E_{r} + E_{env}$
A continuación, utilizamos $S_{env} =k_{B} \ln (\mathcal{N_{env}}(E_{env}) ) \implies \mathcal{N_{env}}(E_{env}) = e^{\frac{S_{env}(E)}{k_B}}$ y Taylor amplió $S_{env}$ sobre $E_{total}$ para conseguirlo,
\begin{equation} \mathcal{N_{env}}(E_{env}) \approx \,e^{\frac{1}{k_B} \left[S_{env}(E_{total}) - \frac{\partial S_{env}}{\partial E_{env}}E_r \right]} \end{equation}
Reconocer $\frac{\partial S_{env}}{\partial E_{env}} = \frac{1}{T}$ nos encontramos con que,
\begin{equation} P_r \,\propto \,e^{-\frac{E_r}{k_BT}}. \end{equation}
La justificación que se da para no tener en cuenta los términos de orden superior dice, por ejemplo $\frac{\partial^2S_{env}}{\partial E_{env}^2} E_r^2$ era que, al tratarse de cantidades extensivas, la escala con el número de partículas, es decir
\begin{equation} \frac{\partial^2S_{env}}{\partial E_{env}^2} E_r^2 \rightarrow \frac{\partial^2(N_{env}S_{env})}{\partial (N_{env}E_{env})^2} (N_rE_r)^2 = \frac{\partial^2S_{env}}{\partial E_{env}^2} E_r^2 \left( \frac{N_r}{N_{env}}\right). \end{equation} Y como $N_r << N_{env}$ esto es válido, sin embargo, me cuesta convencerme de que esto es cierto ya que estamos tratando con derivadas y nos encontramos con discontinuidades en las derivadas con bastante frecuencia en esta asignatura. Yo también me enfrenté al mismo problema con la distribución de Gibbs.
Agradecería cualquier idea sobre por qué funciona esto, y algún enfoque alternativo aparte del mencionado escalado. Soy nuevo en este tema así que también me valdría una explicación no rigurosa.