Considera la aproximación de la siguiente expectativa: $$\mathbb{E}[h(x)] = \int h(x)\pi(x) dx$$
Donde $h(x)$ es una función arbitraria y $\pi(x)$ es una distribución para la que el no se conoce la constante de normalización . Además, asumiendo que la integral anterior es muy variable y de alta dimensión, el enfoque estándar sería utilizar métodos MCMC para muestrear puntos $\{x^{(i)}\}_{i=1}^N$ que se distribuyen según $\pi(x)$ y devuelve la media de la muestra:
$$ \mathbb{E}[h(x)] \approx \frac{1}{N} \sum_{i=1}^N \ h(x^{(i)}) $$
Mi pregunta es, si la función $h(x)$ resulta que también es muy variable, es decir, $\pi(x)$ es muy diferente de la distribución de muestreo óptima $q^*(x) = |h(x)|\pi(x)/Z$ ¿existe una forma sencilla de modificar los métodos MCMC para mejorar la varianza de la estimación? Es decir, ¿cómo puede MCMC (y los métodos relacionados) tener en cuenta la variabilidad (o la dispersión, etc.) de $h(x)$ ?
Además, yo hizo una pregunta relacionada antes sobre si se pueden utilizar los métodos de Monte Carlo para el muestreo de $q^*(x)$ y utilizar el estimador de muestreo de importancia ponderado para compensar el hecho de que el normalizador no es conocido. La respuesta fue básicamente que esto no es una buena idea, ya que requiere estimar la media armónica de $h(x)$ en $q^*(x)$ que, en la práctica, es probable que tenga una varianza infinita. Así que, como mínimo, dejemos de lado este enfoque por ahora.
Editar: Las palabras clave "MCMC de reducción de varianza" son realmente útiles para encontrar métodos que aborden esta cuestión, he encontrado algunos métodos que utilizan variantes de control, variantes antitéticas, y algunos métodos adaptativos como el Monte Carlo de varianza cero. Quizás alguien pueda comentar la viabilidad de estos métodos o añadir más a mi lista. Gracias.
Edición: En respuesta a la respuesta de Xi'an he pensado en actualizar la pregunta.
En primer lugar, parece que mi primera pregunta donde pregunté cómo se podía utilizar MCMC para muestrear de $q^*(x)$ en el caso de que el normalizador para $\pi(x)$ se conoce se aborda en la literatura principalmente como el problema de calcular la constante de normalización, o equivalentemente: evidencia del modelo, función de partición o función de energía.
Parece que hay varios métodos diferentes para hacer esto con MCMC y encontré el capítulo 4 del libro de Iain Murray Tesis doctoral para ser un excelente resumen de las ideas principales. Además, el documento muy reciente citado en la respuesta de Xian detalla un método, MCIS, que ofrece algunas ventajas particulares sobre estos métodos existentes. Sin embargo, después de revisar muchos de estos documentos, tendría que concluir que ninguna de estas ideas ha resultado ser tan "sencilla" como hubiera esperado.
En cuanto a esta pregunta, la respuesta es esencialmente: no, no hay ninguna manera directa de resolver este problema que no sea la estimación de la constante de normalización para $\pi(x)$ por separado. Es decir, si dejamos: $\hat\pi(x) = \pi(x)/Z$ denotan nuestra distribución no normalizada y $I = \int h(x)\hat\pi(x) dx$ denotan la cantidad de interés hasta una constante de normalización, podemos utilizar cualquier método MCMC diseñado para estimar constantes de normalización para estimar $I$ y $Z$ por separado y devuelve la relación $\frac{I}{Z}$ . Sin embargo, todavía no sé cómo se relaciona este sencillo procedimiento con el muestreo de puentes.