Respuesta Corta.
Incluyendo la restricción en la expectativa de que el registro de la velocidad es equivalente a asumir un uniforme de la cuantización de la clásica fase de espacio que, por experiencia, sabemos que es la correcta prescripción para la aplicación de MaxEnt clásica de la mecánica estadística.
Detalles.
Jaynes mostró que el diferencial de la entropía es sólo una adecuada continuidad de la generalización de los discretos de la entropía de Shannon si la discretización uno elige es uniforme. Para una buena discusión de este, me gustaría recomendar la primera lectura de la sección 4b. de Jaynes de la Teoría de la Información y de la Mecánica Estadística conferencias ya que parece como la fuente original si esta observación. También he encontrado un buen artículo de Wikipedia discutir este punto:
La limitación de la densidad de puntos discretos
Jaynes mostró que si uno quiere generalizar la información la entropía de una función de masa de probabilidad en un estado finito espacio para una distribución de probabilidad continua en algunos subpset de $\mathbb R^n$, como cuando tratamos con la clásica fase de espacio, entonces, aunque el diferencial de la entropía anotó parece evidente la generalización se obtendría a partir de la discretización del espacio y de la aplicación de la versión discreta de la entropía, que en realidad supone implícitamente un uniforme de discretización, como dividir el espacio en cubos de igual volumen. La expresión más general que permite una discretización en el que la densidad de estados $m(\vec x)$ sobre el espacio no es necesariamente uniforme es
$$
H[\rho]=-\int \rho(\vec x) \ln \frac{\rho(\vec x)}{m(\vec x)}\, d^n \vec x.
$$
Jaynes reconoce que en el contexto de la mecánica clásica no está claro lo que justifica la elección de un determinado $m$ sobre otra, pero argumenta que si, motivado por la mecánica cuántica, utilizamos la habitual "cuantización" truco de dividir el espacio de fase en las células de un volumen igual de $d^{3}pd^{3}q/h^{3}$, entonces debemos, en consecuencia elija $m(\vec x) = const.$. Si hacemos esto y caída de la importancia global de la constante de que los resultados, podemos utilizar el ingenuo diferencial de la expresión de la entropía
$$
H[\rho] = \int\rho(\vec p, \vec q)\ln \rho(\vec p, \vec q)\, d^{3}\vec pd^{3}\vec q
$$
Por otro lado, observe que si usted desea describir las estadísticas de un sistema clásico usando una distribución de probabilidad sobre el espacio de impulso magnitud $p = |\vec p|$ (o, equivalentemente, de la velocidad), entonces el uniforme de la densidad de estados en el impulso espacio se convierte en un aumento de la densidad de estados en $p$-espacio que depende de la dimensión del espacio Para ver esto, tenga en cuenta que el uniforme de la densidad de estados en el espacio de fase se corresponde con el hecho de que el número de estados en una región dada es proporcional a su volumen. En $d$-dimensiones, el número de estados con los ímpetus entre el $p$ $p+dp$ es por lo tanto proporcional a $p^{d-1}\, dp$. De ello se deduce que debemos tomar
$$
m(p) = (\text{const.})\,p^{d-1}
$$
Ignorando la importancia general de aditivos constantes resultantes de la normalización de $m$ y, a continuación, incluidos los $m\sim p^{d-1}$ en el cálculo de $H$ es equivalente a la adición de un multiplicador de Lagrange plazo en el que el multiplicador de Lagrange tiene valor $d-1$. Para ver esto, observe por un lado, que la inclusión de $m$ y el uso de la versión más general de la $H$ nos hace encontrar los puntos críticos de las siguientes características funcionales:
\begin{align}
J[\rho] &= -\int \rho(p)\ln \rho(p)\, dp \\
&\hspace{1cm}+ \lambda_0\left(\int \rho(p)\, dp - 1\right)+ \lambda_1\left(\int \rho(p) p^2\, dp - C\right) + (d-1)\int \rho(p)\ln(p)\, dp
\end{align}
Por otro lado, el uso de la diferencial de la entropía y la adición de un multiplicador de Lagrange plazo, nos hace encontrar los puntos críticos de la funcional
\begin{align}
G[\rho] &= -\int \rho(p)\ln \rho(p)\, dp \\
&\hspace{1cm}+ \lambda_0\left(\int \rho(p)\, dp - 1\right)+ \lambda_1\left(\int \rho(p) p^2\, dp - C\right) + \lambda_2\left(\int \rho(p)\ln(p)\, dp - K\right)
\end{align}
Cuando nos encontramos puntos críticos de $G$, nos encontramos con que
$$
\rho(p) = C e^{\lambda_1 p^2}e^{\lambda_2 \ln p} = C p^{\lambda_2 }e^{\lambda_1 p^2}
$$
Si hemos de decidir adecuadamente $K$, de modo que $\lambda_2 = d-1$, entonces obtendremos
$$
\rho(p) = C p^{d-1}e^{\lambda_1 p^2}
$$
Para $d=3$ obtenemos un $p^2$ factor en $\rho$, que es precisamente lo que tenemos para el a $3$-dimensiones de Maxwell velocidad de distribución.