Te equivocas al decir que el HMC no es un método de cadenas de Markov. En Wikipedia :
En matemáticas y física, el algoritmo híbrido de Montecarlo, también conocido como Montecarlo Hamiltoniano, es un método de Montecarlo con cadena de Markov para obtener una secuencia de muestras aleatorias de una distribución de probabilidad para la que el muestreo directo es difícil. Esta secuencia puede utilizarse para aproximar la distribución (es decir, para generar un histograma), o para calcular una integral (como un valor esperado).
Para mayor claridad, lea el Artículo arXiv de Betancourt que menciona los criterios de terminación de la NUTS:
... identificar cuándo una trayectoria es lo suficientemente larga como para producir una exploración suficiente de la vecindad alrededor del conjunto de niveles de energía actual. En particular, queremos evitar tanto la integración demasiado corta, en cuyo caso no aprovecharíamos al máximo las trayectorias hamiltonianas, como la integración demasiado larga, en cuyo caso desperdiciamos valiosos recursos computacionales en una exploración que sólo produce rendimientos decrecientes.
El Apéndice A.3 habla de algo parecido a la duplicación de la trayectoria que mencionas:
También podemos expandirnos más rápido duplicando la longitud de la trayectoria en cada iteración, dando lugar a una trayectoria muestreada t ∼ T(t | z) = U T2L con el correspondiente estado muestreado z′ ∼ T(z′ | t). En este caso, tanto los componentes de la trayectoria antigua como la nueva en cada iteración son equivalentes a las hojas de árboles binarios perfectos y ordenados (Figura 37). Esto nos permite construir los nuevos componentes de la trayectoria de forma recursiva, propagando una muestra en cada paso de la recursión...
y lo amplía en A.4, donde habla de una implementación dinámica (la sección A.3 habla de una implementación estática):
Afortunadamente, los esquemas estáticos eficientes discutidos en la Sección A.3 pueden ser iterados para lograr una implementación dinámica una vez que hayamos elegido un criterio para determinar cuándo una trayectoria ha crecido lo suficiente como para explorar satisfactoriamente el conjunto de niveles de energía correspondiente.
Creo que la clave está en que no hace saltos que se duplican, sino que calcula su siguiente salto mediante una técnica que duplica la longitud del salto propuesto hasta que se cumple un criterio. Al menos así es como entiendo el documento hasta ahora.
6 votos
Encontré esto Correo electrónico: y las simulaciones ilustradas realmente marcan la diferencia en la explicación de los conceptos.