Puedo derivar un algoritmo MCMC para el muestreo de la distribución posterior de un vector de parámetros de interés, pero sólo a partir de un conjunto de datos que no tiene valores perdidos. El conjunto de datos real que quiero utilizar para la inferencia tiene una falta sustancial en sus covariables.
Un enfoque sería construir un algoritmo MCMC más complejo que, por ejemplo, rellene primero los datos que faltan con extracciones de la distribución predictiva posterior de los valores que faltan. Sin embargo, esto parece muy difícil.
Lo que preferiría hacer es utilizar un método estándar para generar múltiples imputaciones del conjunto de datos (como un Paquete MICE ), luego ejecutar mi algoritmo MCMC existente en cada conjunto de datos imputados y completos y luego recombinar en estimaciones finales de (por ejemplo) una expectativa posterior o un intervalo posterior para un parámetro de interés.
¿Existe un cuerpo de literatura que intente resolver los problemas de esta manera? ¿O hay una forma mucho mejor de hacerlo? ¿O este enfoque es erróneo o inviable? Cualquier indicación sería útil.