Soy licenciado en empresariales y economía y actualmente estoy estudiando un máster en ingeniería de datos. Mientras estudiaba la regresión lineal (LR) y luego el análisis de series temporales (TS), me surgió una pregunta. ¿Por qué crear un método completamente nuevo, es decir, series temporales (ARIMA), en lugar de utilizar la regresión lineal múltiple y añadirle variables retardadas (con el orden de los retardos determinado mediante ACF y PACF)? Así que el profesor me sugirió que escribiera un pequeño ensayo sobre la cuestión. No iba a venir a buscar ayuda con las manos vacías, así que me puse a investigar sobre el tema.
Ya sabía que cuando se utiliza LR, si se violan los supuestos de Gauss-Markov, la regresión OLS es incorrecta, y que esto ocurre cuando se utilizan datos de series temporales (autocorrelación, etc). (otra pregunta al respecto, un supuesto de G-M es que las variables independientes deben estar distribuidas normalmente o sólo la variable dependiente condicionada a las independientes).
También sé que cuando se utiliza una regresión de rezago distribuido, que es lo que creo que estoy proponiendo aquí, y se utiliza OLS para estimar los parámetros, puede surgir (obviamente) la multicolinealidad entre las variables, por lo que las estimaciones serían erróneas.
En un post similar sobre TS y LR aquí, @IrishStat dijo:
... un modelo de regresión es un caso particular de un modelo de función de transferencia también conocido como modelo de regresión dinámica o modelo XARMAX. Lo más destacado es que la identificación del modelo en las series temporales es decir, las diferencias apropiadas, los rezagos apropiados de las X, la estructura ARIMA apropiada, la identificación apropiada de la estructura determinista no especificada, como los pulsos, los cambios de nivel, las tendencias temporales locales, los pulsos estacionales y la incorporación de cambios en los parámetros o la varianza del error debe ser considerado.
(También leí su artículo en Autobox sobre Box Jenkins vs LR.) Pero esto sigue sin resolver mi pregunta (o al menos no me aclara la diferente mecánica de RL y TS).
Es obvio que incluso con variables retardadas surgen problemas de MCO y no es eficiente ni correcto, pero cuando se utiliza la máxima verosimilitud, ¿persisten estos problemas? He leído que el ARIMA se estima por máxima verosimilitud, así que si el LR con rezagos se estima con ML en lugar de OLS, ¿se obtienen los coeficientes "correctos" (supongamos que incluimos también términos de error rezagados, como un MA de orden q).
En resumen, ¿el problema es OLS? ¿Se resuelve el problema aplicando ML?