1 votos

Una pregunta sobre la heurística multipartida y la pseudoconvergencia

Estoy aprendiendo los métodos MCMC y he encontrado este pasaje en un libro del que no soy capaz de sacar nada en claro:

El fenómeno de la pseudoconvergencia ha llevado a muchas personas a la idea de comparar múltiples ejecuciones del muestreador iniciadas en diferentes puntos. Si las ejecuciones múltiples parecen convergen a la misma distribución, entonces -según la heurística del multiarranque- todo va bien. Pero esto supone que se puede disponer de al menos un punto de partida en cada parte del del espacio de estados al que el muestreador pueda pseudoconvertirse. Si no se puede hacer eso -y en la situación de situación de caja negra, nunca se puede, entonces la heurística multipartida es peor que inútil: puede puede darle la confianza de que todo está bien cuando en realidad sus resultados son completamente erróneos.

¿Alguien puede explicar esto un poco mejor?

1voto

Brian Borchers Puntos 2546

No me queda claro si estás preguntando qué es la pseudoconvergencia, o si estás preguntando cómo puede fallar el multistart para detectar que está ocurriendo la pseudoconvergencia, así que intentaré responder a ambas cosas brevemente.

Imagina que estás usando MCMC para muestrear de una distribución donde $X$ tiene una alta probabilidad (digamos el 99,9%) de estar distribuida uniformemente entre 0 y 1, y una pequeña probabilidad (digamos el 0,1%) de estar distribuida uniformemente entre 1.000.000 y 1.000.001. Este es un problema de caja negra, por lo que al construir la distribución de la propuesta para el muestreador MCMC se podría hacer algo ingenuo como considerar los saltos que están a N(0,1) del punto actual. En estas circunstancias, si empiezas en un punto en [0,1], entonces es prácticamente imposible que tu secuencia MCMC llegue alguna vez al intervalo aislado [1.000.000, 1.000.001]. Su muestreador MCMC convergerá entonces muy bien a una distribución U(0,1). Las pruebas de convergencia convencionales se verán muy bien, pero habrá convergido a una distribución incorrecta.

Se podría argumentar que la falta de ese otro 0,1% de la distribución realmente no importa. Dependiendo del aspecto de la distribución que le interese, esto podría ser un problema muy serio. Por ejemplo, si quiere estimar $E[X]$ , obtendrás 0,5 como estimación, ¡cuando debería ser alrededor de 1.000!

Este es un ejemplo de falsa o pseudoconvergencia.

Ahora, suponga que elige un grupo de puntos de partida y ejecuta el muestreador MCMC desde cada uno de esos puntos de partida. Mientras cada uno de estos puntos de partida esté cerca de [0,1], cada ejecución de MCMC convergerá finalmente a una distribución U(0,1), y se le hará creer que $X$ realmente tiene una distribución U(0,1). Ese es el peligro potencial de confiar en la heurística multipartida.

El ejemplo que he utilizado aquí es ciertamente extremo. Sin embargo, la pseudoconvergencia se da a menudo en la práctica, sobre todo en problemas en los que estamos muestreando en un espacio de muy alta dimensión y hay muchas regiones aisladas con una probabilidad razonablemente alta.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X