9 votos

Detección del punto de conmutación con programación probabilística (pymc)

Actualmente estoy leyendo el Probabilístico de Programación y Métodos Bayesianos para los Hackers "libro". He leído un par de capítulos y me quedé pensando en el primer Capítulo, donde el primer ejemplo con pymc consisten en la detección de un witchpoint en mensajes de texto. En el ejemplo de la variable aleatoria para indicar cuando el switchpoint que está sucediendo es indicado con $\tau$. Después de la MCMC paso la distribución posterior de los $\tau$ se da: enter image description here

En primer lugar, qué se puede aprender de este gráfico es que hay un propability de casi el 50% de que el switchpoint que ha ocurrido en el día 45. A pesar de lo que si no había un switchpoint ? En lugar de asumir que hay un switchpoint y, a continuación, tratando de encontrar, me quiere detectar si existe en realidad un switchpoint.

El autor responde a la pregunta "¿un switchpoint pasar" por "no Tuvo ningún cambio se produjo, o tenía el cambio ha sido gradual a lo largo del tiempo, la distribución posterior de los $\tau$ habría sido más hacia fuera". Pero ¿cómo se puede responder a esto con un propability, por ejemplo hay un 90% de probabilidad que switchpoint que ha ocurrido, y hay un 50% de probabilidades de que ha ocurrido en el día 45.

¿El modelo necesita ser cambiado ? O puede ser respondida con el modelo actual ?

6voto

user11867 Puntos 21

SeanEaster tiene algunos buenos consejos. Factor de Bayes puede ser difícil de calcular, pero hay algunas buenas entradas de blog específicamente para el factor de Bayes en PyMC2.

Un closly relacionados con la cuestión es de bondad de ajuste de un modelo. Un método justo para esto es sólo en las inspecciones posteriores nos puede dar pruebas de bondad de ajuste. Como citado:

"No tuvo ningún cambio se produjo, o tenía el cambio ha sido gradual a lo largo del tiempo, la distribución posterior de los $\tau$ habría sido más hacia fuera"

Esto es cierto. La parte posterior es bastante alcanzó su punto máximo cerca de 45. Como usted dice > 50% de la misa es a los 45 años, mientras que si no hay un punto de cambio de la masa debería (en teoría) de estar más cerca de 1/80 = 1.125% en vez de 45.

Lo que se propone hacer es reconstruir fielmente a los datos observados conjunto, dado su modelo. En el Capítulo 2, son simulaciones de generación de datos falsos. Si sus datos observados se ve tremendamente diferente a la de su artificial de datos, entonces es probable que su modelo no es el correcto ajuste.

Pido disculpas por la no-riguroso respuesta, pero en realidad es una de las principales dificultades que no he eficiente de superar.

2voto

Steve Puntos 477

Se trata más bien de un modelo de comparación de la pregunta: El interés es en si un modelo sin switchpoint mejor explica los datos de un modelo con un switchpoint. Un enfoque para responder a esa pregunta es para calcular el factor de Bayes de los modelos con y sin switchpoint. En resumen, el factor de Bayes es el cociente de las probabilidades de los datos en virtud de ambos modelos:

$K = \frac{\Pr(D|M_1)}{\Pr(D|M_2)} =\frac{\int\Pr(\theta_1|M_1)\Pr(D|\theta_1,M_1)\,d\theta_1}{\int \Pr(\theta_2|M_2)\Pr(D|\theta_2,M_2)\,d\theta_2}$

Si $M_1$ es el modelo utilizando un switchpoint, y $M_2$ es el modelo sin, a continuación, un alto valor de $K$ puede ser interpretado como fuertemente favoreciendo la switchpoint modelo. (El artículo de la wikipedia vinculado anterior nos da las pautas para qué valores de K son dignos de mención.)

También tenga en cuenta que en un MCMC contexto de la anterior integrales sería reemplazado con las sumas de los valores de los parámetros de la MCMC cadenas. Un tratamiento más exhaustivo de los factores de Bayes, con ejemplos, está disponible aquí.

A la pregunta de calcular la probabilidad de que un switchpoint, que es el equivalente a la solución de $P(M_1|D)$. Si usted asume la igualdad de los priores a través de los dos modelos, a continuación, la parte posterior de las probabilidades de los modelos son equivalentes para el factor de Bayes. (Ver lámina 5 aquí.) Entonces es sólo una cuestión de resolver para $P(M_1|D)$ utilizando el factor de Bayes y el requisito de que $\sum\limits_{i=1}^n P(M_i|D) = 1$ n (exclusivo) modelo de eventos de bajo consideración.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X