El Modelo Causal de Rubin (MCR), también llamado Marco de Resultados Potenciales, asume que cualquier unidad de una población tiene resultados potenciales bajo cualquier tratamiento relevante en un estudio. Por ejemplo $Y_1$ denota el resultado bajo tratamiento, $Y_0$ el resultado bajo control. En un experimento no aleatorio, el hecho de que en la expectativa la cantidad
$$E(Y_1|T=1) - E(Y_0|T=0)$$
se observa en la expectativa como la diferencia media entre las unidades tratadas y las no tratadas, donde $T$ denota la asignación del tratamiento, provoca un sesgo de selección contra el efecto medio del tratamiento
$$E(Y_1-Y_0).$$
El problema principal es que parte de los datos necesarios para la inferencia causal no se observan, en particular $E(Y_1|T=0)$ y $E(Y_0|T=1)$ . Existen varios enfoques para la inferencia sobre este efecto del tratamiento, entre los que destacan la ponderación, la estratificación o alguna otra forma de emparejamiento en la puntuación de propensión.
Un enfoque alternativo trata de estimar las distribuciones de resultados potenciales no observados $P(Y_1,Y_0)$ directamente mediante técnicas bayesianas, como la imputación múltiple. ¿Cuáles son los principales trabajos que intentan la inferencia causal resolviendo el problema de los datos perdidos mediante imputación múltiple u otras técnicas bayesianas?