A veces tengo un gran número de variables latentes en un modelo jerárquico Bayesiano para que, pero yo sólo estoy interesado en la estimación proyectada transformaciones de esas variables latentes (por ejemplo, voy a parametrizar una binomial de parámetros como la inversa logit de un conjunto de posiblemente-no identificable covariables, a pesar de que el resultado que me interesa es el binomio estimación del parámetro).
La proyección de transformaciones a menudo convergen de manera muy rápida (basado en la convergencia de diagnóstico, tales como la Gelman/Rubin o mirando hacia la parte posterior de las muestras), incluso si las variables latentes no han convergido.
Intuitivamente este sentido, el modelo puede ser una overparameterization donde la latente parámetros no son identificables - los derivados de las cantidades que están obligados a estar en un limitado a un estrecho alta probabilidad región de las variables transformadas' espacio de parámetros que se asigna a una mucho más grande en gran parte plana de la probabilidad (pero limitado) de la región de la variable latente en el espacio de parámetros.
Así es la intuición correcta de que yo no debería estar preocupado de que el overparameterized variables latentes no son identificables y no son totalmente convergente cuando me tome mi posterior de las muestras? Hay algunas buenas referencias que discutir el uso de la no-identificado variables latentes de esta manera? He oído algo de debate sobre la overparameterizing para acelerar la mcmc convergencia, pero no estoy del todo claro cómo pensar acerca de esto, como los enfoques y actitudes hacia overparameterization y no identificabilidad en bayesiano métodos parece ser un poco diferente que en otras áreas de modelado.