Esto se llama la re-transformación problema. Voy a hacer que su modelo un poco más simple para hablar de ello:
lnY=β0+β1X1+β2X2+β3X22+ϵ
Ahora, ese modelo no hacer predicciones para Y, hace predicciones para lnY. Es tentador hacer predicciones para Y solo tomando las predicciones para lnY y exponentiating ellos como ˆY=exp(^lnY). Esto está mal (es decir, sesgada), a pesar de que:
lnY=β0+β1X1+β2X2+β3X22+ϵY=exp(β0+β1X1+β2X2+β3X22)exp(ϵ)E{Y|X}=exp(β0+β1X1+β2X2+β3X22)E{exp(ϵ)|X}ˆE{Y|X}=exp(^lnY)E{exp(ϵ)|X}
El mejor predictor de la Y es su expectativa. Si podríamos concluir que E{exp(ϵ)|X}=1, entonces podríamos exponentiate como usted está sugiriendo arriba. Pero la desigualdad de Jensen afirma que, desde la E{ϵ|X}=0,E{exp(ϵ)|X}>1. Así, tenemos que utilizar algún tipo de ajuste. El ajuste se llama Duan la Borrosidad de Estimador. Es simplemente la media de la muestra de la exponentiated errores de predicción (residuos) a partir del modelo original, (1/N)∑exp(ei). Así que la forma correcta de volver a transformar a partir del registro del modelo de predicciones de Y es:
ˆYj=exp(^lnYj)⋅1NN∑i=1exp(ei)
A sus preguntas. En los parámetros, si usted necesita para volver a transformar depende de lo que estamos tratando de medir. El parámetro β2 mide la cantidad que Y va para arriba (en porcentajes) para una unidad de incremento en X1. Por lo tanto, si β2=0.04, que dice que Y sube un 4% para cada uno de la unidad de X1 va para arriba. Del mismo modo, para cada unidad deX2, Y sube β2+2β3X2 por ciento.
Si desea medir la cantidad que Y sube en unidades al X2 sube por una unidad, entonces usted necesita para volver a transformar:
Y=exp(β0+β1X1+β2X2+β3X22)exp(ϵ)∂Y∂X1=exp(β0+β1X1+β2X2+β3X22)exp(ϵ)β1ˆE{∂Y∂X1}=exp(^lnY)⋅1N∑exp(ei)⋅β1
Observe que la respuesta depende de a ˆY, totalmente a diferencia de "regular" de la regresión. Usted debe esperar esto, sin embargo. El modelo es no lineal, por lo que la derivada depende del punto de evaluación. Para su más complicado modelo, usted tiene que tener cuidado de aplicar la regla de la cadena correctamente---que es, de donde he a β1, tendrá un complicado expresión con βs y los poderes de los distintos Xs y tal.
Para los intervalos de confianza, de nuevo, la pregunta es lo que estamos tratando de medir. Si usted es feliz con saber cuántos porcentajes Y sube al X1 va por uno, a continuación, la "normal" de los intervalos de confianza que se obtiene de la costumbre de regresión de salida están bien. Si usted quiere medir el número de unidades que Y sube al X1 va por uno, entonces es más complicado. En realidad, es muy complicado en ese caso--- - usted debe utilizar bootstrap para hacerlo. Usted puede usar algo que se llama el método delta, pero es un dolor.
Raíz del error cuadrático medio de la predicción es fácil de calcular, una vez que han re-transformada a la predicha Y:
RMSEP=√1N−1∑(ˆYi−Yi)2
donde ˆYi proviene de la fórmula anterior.