Mi problema es el siguiente: Estoy evaluando el ajuste a una función f(x,θ) a través de MCMC (porque tengo algunos priors en los parámetros), y estoy tratando de evaluar el DIC, dado por:
DIC=ˉD+pD, (1)
donde, si definimos la desviación D(θ)=−2log(L(θ|x)) y L(θ|x) es mi probabilidad, entonces ˉD=Eθ[D]=−2Eθ[log(L(θ|x))], (2) donde Eθ[⋅] representa el valor esperado sobre la distribución posterior, y el número efectivo de parámetros , pD viene dada por pD=ˉD−D(ˆθ) (3) donde ˆθ es la expectativa posterior de los parámetros. Esto es lo que he entendido hasta ahora del artículo de Spiegelhalter et al. (2002) .
El caso es que, sólo a efectos de prueba, estoy utilizando una probabilidad gaussiana simple de la forma: L(θ|x)=1(2πσ2)n/2exp(−n∑i=1xi−fi(θ)2σ2), y estoy recibiendo ENORME valores para pD . En σ como parámetro y el hecho de que θ es de 12 dimensiones en mi aplicación particular, esperaría valores de pD cercano a 13, ¡pero obtengo valores del orden de 900! Lo que estoy haciendo para evaluar todo es lo siguiente:
- Después de adelgazar mi cadena MCMC, para cada eslabón, obtengo un valor de la probabilidad. Esto me da una muestra del valor de la verosimilitud en cada eslabón, y luego estimo Eθ[D] como: ˆD=1LL∑i=1D(θi), donde L es el número de enlaces y θi es el valor de los parámetros (incluido σ ) en ese enlace.
- Obtengo la media posterior de mis parámetros a partir de todos mis enlaces MCMC (suponiendo que estoy muestreando a partir de la posterior) para obtener ˆθ . Con estimaciones para esto y para Eθ[D] , sólo tengo que sustituir los valores de las ecs. (2) y (3) para obtener (1).
Con este procedimiento obtengo valores razonables para mi estimación de Eθ[D] pero pD simplemente no parece correcto. ¿Hay algo mal en mi procedimiento?
Gracias de antemano por la ayuda.