5 votos

¿Puede utilizar variables de serie de tiempo autorregresiva dentro de un modelo de regresión?

Estamos trabajando en un modelo de regresión lineal multivariado. Nuestro objetivo es pronosticar el trimestral % de crecimiento en los préstamos hipotecarios pendientes.

Las variables independientes son: 1) Dow Jones nivel. 2) % de cambio en el Dow Jones el pasado trimestre. 3) Case Shiller índice de precios de vivienda. 4) % de cambio en el Caso de Shiller índice de precios de vivienda durante el pasado trimestre.

En una regresión paso a paso el proceso, todas las variables fueron seleccionadas. Y, las variables 1) y 3) fueron sorprendentemente significativo. Pero, que es cuando se usa en combinación. De alguna manera, hay algo acerca de la diferencia en los dos indeces que no se explican en parte el % de cambio en los préstamos hipotecarios pendientes.

Por mi parte, me parece variables 1) y 3) la problemática. Esto es porque creo que son heteroskedastic. Y, sus respectivos coeficientes de intervalo de confianza son por lo tanto poco fiables. También creo que puede haber problemas de multicolinealidad con sus variables relacionadas con el basado en el porcentaje de cambio. También puede causar algunos problemas de autocorrelación.

Sin embargo, al principio parece que algunos de mis preocupaciones puede ser exagerada. Después de graficar los residuos de todo el modelo parecen ACEPTAR. No tendencia al alza. Así, parece que la heterocedasticidad no es un problema para todo el modelo. La multicolinealidad no es demasiado malo. La variable con mayor VIF es de alrededor de 5 mucho menor que el habitual umbral de 10.

Sin embargo, todavía estoy un poco preocupado de que a pesar de que el modelo parece bien; las específicas para los coeficientes de regresión de las variables no pueden ser (o más específicamente, las relacionadas con los intervalos de confianza).

4voto

Marc-Andre R. Puntos 789

Su variable dependiente es el crecimiento. Económico en los datos de series de tiempo es más probable que el crecimiento será de un proceso estacionario. Esto significa que va a tener media constante. El nivel de datos en el otro lado por lo general no son estacionarias. Desde su modelo de regresión lineal que se supone que la verdadera generadora de datos de proceso se

$$Y_t=\alpha_0+X_{1t}\alpha_1+...+X_{kt}\alpha_k+u_t$$

donde $u_t$ es un ruido blanco, $Y_t$ es estacionaria y $X_{kt}$ son no estacionarias. Ahora estacionariedad implica que

$$EY_t=const=\alpha_0+\alpha_1EX_{1t}+...+\alpha_kEX_{kt}$$.

Ahora $EX_{kt}$ son funciones del tiempo, que para los no-estacionario procesos de cambios con el tiempo. Lo que implica que el

$$\alpha_0+\alpha_1\mu_1(t)+...+\alpha_k\mu_k(t)=const$$

para algunos no-constante de las funciones de $\mu_k(t)$. Este lugares muy graves restricciones de no-estacionario procesos de $X_{kt}$. Por ejemplo, si tenemos sólo una variable independiente de esta restricción se convierte en

$$\alpha_1\mu_1(t)=const-\alpha_0$$

así que o $\mu_1$ es constante o $\alpha_1$ es cero. En el primer caso esto contradice la presunción, $X_1$ es no estacionaria en el segundo caso, el modelo de regresión no es de ninguna utilidad.

Así que en general esta es la razón por la que no es una buena idea mezclar los niveles y crecimientos en la regresión, a menos que usted está realmente seguro de que todos ellos son estacionarias.

Otro problema con el tiempo de la serie de regresión que para cierta clase de no-estacionariedad de los procesos de la regresión puede ser espuria. En este caso no se puede confiar en las estimaciones de mínimos cuadrados $\hat{\alpha}_k$, ya que en la regresión espuria caso de que su distribución no es normal, y no tienden a la normalidad, así que de costumbre estadísticas de la regresión no se aplican. Por ejemplo, usted puede disfrutar de la $\alpha_k$ es significativamente distinto de cero, cuando en realidad es cero. Así que antes de que la regresión es siempre una buena idea para comprobar si las variables no están integrados utilizando alguna variante de Dickey-Fuller prueba. Tengo la fuerte sospecha de que el índice Dow Jones es el proceso integrado.

Ahora, como otros señalaron, heterocedasticidad en el independiente de regresión de la variable es inofensivo. Los problemas pueden surgir si los errores de regresión son heteroscedastic. A continuación, las estimaciones de mínimos cuadrados será constante, pero ineficaces, también los errores estándar debe ser ajustado, para la prueba de hipótesis.

1voto

Mike Moore Puntos 641

Usted está tratando de nivel de mezcla y el flujo de datos en una regresión. Acaba de darse cuenta, que el porcentaje de cambio podría ser considerado como una cierta transformación de la variable de nivel (como las devoluciones y registro-devuelve en econometría financiera). Así que desde su variable dependiente es el porcentaje de cambio, cuando se incluyen los niveles, que intenta "imitar" la estacionariedad en lugar de estocásticos movimiento, y es probable que se puede formar co-integración de relación (de probar esto de todos modos). Otro "truco" para hacer que el nivel de la serie estacionaria es tratar de fracciones si tienen algún sentido o considerar las diferencias (como la tasa de interés plazo-estructura).

Y estoy de acuerdo en que no es la heterocedasticidad que forma el problema. Piense con cuidado acerca de la teoría que usted está construyendo su modelo de previsión.

La buena suerte.

0voto

pek Puntos 6412

bueno, a probar y ayuda, con Heteroskedasticidad presentes, los estimadores de mínimos cuadrados son todavía imparcial pero ya no más eficaz, ya no tiene varianza más pequeña violación de parte de la theorum de Gauss Markov. Puedo equivocarme, pero yo creo que son errores estándar se realizan más de multicolinealidad que heterosked. Multicoll infla sus errores estándar, valores de T se convierten en más pequeño y lleva a aumento de la probabilidad de mantener la hipótesis nula falsa.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X