Estamos trabajando en un modelo de regresión lineal multivariado. Nuestro objetivo es pronosticar el trimestral % de crecimiento en los préstamos hipotecarios pendientes.
Las variables independientes son: 1) Dow Jones nivel. 2) % de cambio en el Dow Jones el pasado trimestre. 3) Case Shiller índice de precios de vivienda. 4) % de cambio en el Caso de Shiller índice de precios de vivienda durante el pasado trimestre.
En una regresión paso a paso el proceso, todas las variables fueron seleccionadas. Y, las variables 1) y 3) fueron sorprendentemente significativo. Pero, que es cuando se usa en combinación. De alguna manera, hay algo acerca de la diferencia en los dos indeces que no se explican en parte el % de cambio en los préstamos hipotecarios pendientes.
Por mi parte, me parece variables 1) y 3) la problemática. Esto es porque creo que son heteroskedastic. Y, sus respectivos coeficientes de intervalo de confianza son por lo tanto poco fiables. También creo que puede haber problemas de multicolinealidad con sus variables relacionadas con el basado en el porcentaje de cambio. También puede causar algunos problemas de autocorrelación.
Sin embargo, al principio parece que algunos de mis preocupaciones puede ser exagerada. Después de graficar los residuos de todo el modelo parecen ACEPTAR. No tendencia al alza. Así, parece que la heterocedasticidad no es un problema para todo el modelo. La multicolinealidad no es demasiado malo. La variable con mayor VIF es de alrededor de 5 mucho menor que el habitual umbral de 10.
Sin embargo, todavía estoy un poco preocupado de que a pesar de que el modelo parece bien; las específicas para los coeficientes de regresión de las variables no pueden ser (o más específicamente, las relacionadas con los intervalos de confianza).