Estoy tratando de implementar HMC con un no-diagonal de la matriz de masa, pero estoy errado por parte de la terminología.
De acuerdo a BDA3 y Neal de la revisión, el término de energía cinética (que supongo que siempre se utiliza debido a la comodidad) es
$$ K(p) = \frac{p^T M^{-1} p}{2} \,.$$
Esto es fácilmente reconocible también llamado una normal multivariante con cero la media y la matriz de covarianza $M$. BDA3 (página 301) dice
Para mantenerlo simple, que comúnmente usamos un diagonal de la matriz de masa, M. Si es así, las componentes de f son independientes, con φj ∼ N(0,Mjj) para cada dimensión, j = 1, . . . d. Puede ser útil para M, aproximadamente, de la escala con la inversa de la matriz de covarianza de la distribución posterior, (var(θ|y))^-1.
(Estoy leyendo N(0, M)) como un multivariante normal con media cero y covarianza M.)
La parte disparo de mí es donde dice que "puede ser útil para $M$ a aproximadamente escala con la inversa de la matriz de covarianza de la distribución posterior...".
Y luego también, justo antes de que el impulso de la muestra que se inicia el salto pasos ($\phi$) se extrae de una normal multivariante con la covarianza de la matriz $M$.
Así que es? Para construir una buena M para HMC, puedo estimar la covarianza o precisión de la matriz de la parte posterior? Aunque $M$ es la matriz de covarianza de la energía cinética, el uso de un $M$ que es una estimación de la precisión de la matriz de la parte posterior producirá un algoritmo más eficiente?
Secundaria pregunta: ¿qué es la intuición de que podía guiar a mí aquí?
¿Quieres usar una precisión de la matriz, de modo que el impulso que empuja ortogonalmente a la potencial/posterior para mejorar la mezcla?
O ¿quieres que el impulso para empujar hacia la alta probabilidad de la masa de la parte de la parte posterior (porque es ahí donde se desea dibujar la mayoría de las muestras).
p.s. La razón por la que no voy a usar la matriz de identidad para $M$ es porque para mi el problema se me ocurre para poder obtener decente estimación de la matriz de covarianza de mi bastante alto dimensiones (~1000) posterior de antemano.