20 votos

MCMC en un acotado espacio de parámetros?

Estoy tratando de aplicar MCMC en un problema, pero mi priores(en mi caso son $\alpha\in[0,1],\beta\in[0,1]$)) están restringidas a un área de? Puedo usar normal MCMC y de ignorar las muestras que caen fuera de la zona restringida(que en mi caso es [0,1]^2), es decir, la reutilización de transición de la función cuando la nueva transición se cae de restricted(restringida) de la zona?

34voto

bheklilr Puntos 113

Usted tiene varios agradable, más o menos simple, opciones. Su uniforme antes de la ayuda a hacerlos más sencillos.

Opción 1: la Independencia de sampler. Sólo puede establecer su propuesta de distribución igual a una distribución uniforme sobre la unidad de la plaza, lo que garantiza que las muestras no se caiga fuera de la zona restringida, como usted la llama. Potencial desventaja: si la parte posterior está concentrada en una región muy pequeña de la unidad de square, usted puede tener una muy baja tasa de aceptación. OTOH, es difícil generar números aleatorios más rápido que de una U(0,1) de distribución. Potencial de alza: menos trabajo para usted.

Opción 2: Transformar los parámetros a algo que no es limitada, hacer propuestas para la transformación de los parámetros, luego de transformar los parámetros para su uso en la probabilidad de funciones. Tenga en cuenta que en este caso la previa va a ser en la transformación de los parámetros, porque eso es lo que estamos haciendo propuestas para, por lo que tendrá que meterse con el Jacobiano de la transformación para obtener el nuevo prior. Para su análisis, por supuesto, usted va a transformar la MCMC-parámetro generado números aleatorios de nuevo a los parámetros originales. Potencial desventaja: más trabajo inicial para usted. Pptential boca: mejor tasa de aceptación de sus propuestas.

Opción 3: Construir una propuesta de distribución que no sea una independencia sampler que está en la plaza de la unidad. Esto le permite mantener su uniforme antes, pero a costa de una mayor complejidad a la hora de calcular la propuesta de probabilidades. Un ejemplo de esto, dejando $x$ el valor actual de uno de sus parámetros, sería una distribución Beta con parámetros de $(nx, n(1-x))$. El mayor $n$, la más concentrada que su propuesta estará en torno al valor actual. Potencial desventaja: más trabajo inicial para usted. Pptential boca: mejor tasa de aceptación de sus propuestas -, pero si usted hace $n$ demasiado grande, y se mueven cerca de la esquina, usted podría terminar encima de hacer un montón de pequeños movimientos en la esquina antes de levantarse.

Opción 4: rechazar cualquier propuesta que caen fuera de la unidad cuadrada (Xian es a medias sugerencia). Tenga en cuenta que este no es el mismo como se acaba de generar otra propuesta; en este caso, se está rechazando la propuesta, lo que significa que su siguiente valor para el parámetro es el mismo que el valor actual del parámetro. Esto funciona porque es lo que pasaría si usted tuviera un cero antes de probabilidad para algunos una región del espacio de parámetros y genera un número aleatorio que cayó en la región. Potencial desventaja: si usted consigue cerca de una esquina, usted puede tener una baja probabilidad de aceptación y quedarse por un tiempo. Potencial de alza: menos trabajo para usted.

Opción 5: Crear un extendido problema en el avión en el que, en la unidad de la plaza, es el mismo que el real problema que se enfrenta, lo hacen todo bien, entonces, cuando el post-procesamiento de los resultados de la MCMC de muestreo, tirar todas las muestras fuera de la unidad de la plaza. Potencial de alza: Si es muy fácil de crear que se extendió problema, puede ser menos trabajo para usted. Potencial desventaja: si la cadena de Markov se pasea en algún lugar fuera de la unidad de la plaza por un tiempo, usted puede tener, en efecto, horrible probabilidades de aceptación, como va a tirar la mayoría de sus muestras.

No cabe duda de que hay otras opciones, yo estaría interesado en ver lo que otras personas sugieren!

La diferencia entre el 2 y el 3 es hasta cierto punto conceptual, aunque con consecuencias reales de lo que en realidad hacemos. Probablemente me vaya con 3, como yo acababa de dejar que R me dicen lo que la propuesta de probabilidades (si estoy de programación en R) y la cantidad de esfuerzo extra, aparte de la optimización de la propuesta de distribución del parámetro $n$, se ve pequeño para mí. Si estaba usando PUNTAS o ERRORES, por supuesto, que sería un asunto completamente diferente, dado que estas herramientas para manejar sus propias propuestas.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X