Tengo dos conjuntos de datos, uno en el que tengo mis covariables $X_1$ y mi resultado observado $Y_1$ y otra en la que sólo tengo mi covariable $X_2$ . Quiero predecir $\hat{Y}_2$ . Sin embargo, tengo indicadores mucho mejores ( $R^2$ y $AIC$ o $BIC$ por ejemplo), si estimo sobre el modelo transformado logarítmicamente :
$$ ln(Y_1) = \beta X_1 + u_1 $$
Entonces puedo predecir $$ \widehat{ln(Y_2)} = \hat{\beta}X_2 $$
Pero entonces para obtener de nuevo mi $\hat{Y}_2^*$ ¿simplemente tengo que conseguir $$\exp(\widehat{ln(Y_2)})$$
¿O el hecho de que la media de una variable lognormal $Z$ (es decir que $W=ln(Z)$ es normal) tiene una media de $\exp(\mu_W+\dfrac{\sigma_W^2}{2})$ significa que tengo que corregir mi ecuación anterior en algo como $$\exp(\widehat{ln(Y_2)})+\dfrac{\widehat{\sigma_{u_1}^2}}{2})$$
¿O estoy mezclando cosas que no tienen nada que ver?
Pregunta relacionada : ¿Qué transformación de $\widehat{ln(Y_1)}$ dada una estructura de $u_1$ (tengo probable heteroskedascity) necesitaría de para obtener $$ \mathbb{E}(Y_1)=\mathbb{E}(\hat{Y_1^*}) $$
EDIT : Notas mejoradas gracias a la observación de Taylor
EDIT2 : Añadida mi pregunta relacionada