Tengo un problema donde
$$y = a + b $$
Observo y, pero ni $a$ ni $b$. Yo quiero estimar
$$b = f(x) + \epsilon$$
Me puede hacer una estimación de $a$, el uso de algún tipo de modelo de regresión. Esto le da a me $\hat b$. Entonces yo podría estimar
$$\hat b = f(x) + \epsilon$$
Primer problema: un modelo de regresión para predecir $a$ podría llevar a $\hat b$ ser negativo, lo cual no tendría ningún sentido. No está seguro de cómo conseguir alrededor de esto (no el tipo de problema que he tratado con muchísimo), pero parece que el tipo de cosa que otros se ocupen de manera rutinaria. Algún tipo de no-gaussiano GLM?
El principal problema es cómo dar cuenta de la incertidumbre en el modelo principal que proviene de la estimación de $\hat b$. He usado varios de imputación antes por falta de covariables. Pero esto es una falta "latente parámetro." Por otra parte, es el resultado de la investigación, que parece ACEPTAR la imputación. Sin embargo, a menudo escucho de EM se utiliza para "latente" de los parámetros. No estoy seguro de por qué, ni sé si EM es mejor en estos contextos. MI es intuitivo tanto para comprender, aplicar y comunicar. EM es intuitivo de entender, pero parece más difícil de implementar (y todavía no he hecho).
Es EM superior para el tipo de problema que tengo encima? Si es así, ¿por qué? Segundo, ¿cómo se implementan en R para un modelo lineal, o para un semiparamétrico (GAM) modelo?