3 votos

Volver a transformar tras una transformación logarítmica

Tengo dos conjuntos de datos, uno en el que tengo mis covariables $X_1$ y mi resultado observado $Y_1$ y otra en la que sólo tengo mi covariable $X_2$ . Quiero predecir $\hat{Y}_2$ . Sin embargo, tengo indicadores mucho mejores ( $R^2$ y $AIC$ o $BIC$ por ejemplo), si estimo sobre el modelo transformado logarítmicamente :

$$ ln(Y_1) = \beta X_1 + u_1 $$

Entonces puedo predecir $$ \widehat{ln(Y_2)} = \hat{\beta}X_2 $$

Pero entonces para obtener de nuevo mi $\hat{Y}_2^*$ ¿simplemente tengo que conseguir $$\exp(\widehat{ln(Y_2)})$$

¿O el hecho de que la media de una variable lognormal $Z$ (es decir que $W=ln(Z)$ es normal) tiene una media de $\exp(\mu_W+\dfrac{\sigma_W^2}{2})$ significa que tengo que corregir mi ecuación anterior en algo como $$\exp(\widehat{ln(Y_2)})+\dfrac{\widehat{\sigma_{u_1}^2}}{2})$$

¿O estoy mezclando cosas que no tienen nada que ver?

Pregunta relacionada : ¿Qué transformación de $\widehat{ln(Y_1)}$ dada una estructura de $u_1$ (tengo probable heteroskedascity) necesitaría de para obtener $$ \mathbb{E}(Y_1)=\mathbb{E}(\hat{Y_1^*}) $$

EDIT : Notas mejoradas gracias a la observación de Taylor

EDIT2 : Añadida mi pregunta relacionada

3voto

Taylor Puntos 692

Puede exponenciar las predicciones del modelo transformado logarítmicamente. Eso está bien. Como dices en este caso tu predicción será $$ \hat{Y}_2^* = \exp\left[ \widehat{\ln(Y_2)}\right]. $$

Fíjate que estoy poniendo el sombrero sobre la parte del logaritmo natural. Esto es para enfatizar el hecho de que exponenciar no sólo deshace tomar el logaritmo. Usted parece tener una especie de notación engañosa, con respecto a esto. Además, la numeración también me parece confusa.

Como usted señala habrá "sesgo", porque $$ E \left[ \exp\{\widehat{\ln(Y_2)}\} \right] \neq EY_1, $$ y la varianza no es igual a lo que se puede sospechar: $$ \text{Var} \left[ \exp\{\widehat{\ln(Y_2)}\} \right] \neq \text{Var}(Y_1). $$ Puede que desee aproximar este último con algo como el Método Delta, o puede calcularlo exactamente ya que conoce $\exp\{\widehat{\ln(Y_2)}\}$ tiene una distribución log-normal.

Edita:

Si intenta transformar con $\exp(\widehat{ln(Y_2)})+\dfrac{\sigma_u^2}{2})$ Bueno, en primer lugar, no "sabes" $\sigma$ Así que es imposible, pero si lo hicieras, seguiría teniendo una distribución lognormal y podrías calcular su distribución. Pero ten cuidado, que podría significar restar $\sigma_u^2/2$ . Así que si conoces la varianza, $$ \hat{Y}_2^{**}=\exp(\widehat{ln(Y_2)})-\dfrac{\sigma_u^2}{2}) $$ tendría la media correcta.

En la práctica, puede utilizar alguna estadística de muestra $\hat{\sigma}^2_u$ . Eso también está bien, pero no seguiría una distribución log-normal. Habría más trabajo derivando propiedades de este tipo.

0voto

Knarpie Puntos 143

Simplemente retrotransformando con

$$exp(ln(\hat{Y_2}))$$

está bien, sólo piensa en tu variable transformada como

$$Z = ln(Y)$$ y de repente todo parecerá muy ordinario. Para los errores estándar que necesita para utilizar el método delta supongo.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X