Dos clases de modelos de series temporales, algo similares entre sí, se me ocurren como potencialmente útiles en este contexto: los modelos ARMAX y los modelos ARDL. Permítanme preparar la escena refrescando la memoria y recordándoles cómo son estos modelos (de forma breve, por favor, refresquen la memoria).
ARMAX
Un modelo ARMAX le proporcionaría un marco para explicar el número de nuevos empleos no sólo por el índice de desarrollo empresarial (la variable explicativa), sino también por sus propios valores retardados (términos AR) y las perturbaciones (términos MA). Este tipo de modelo, conocido como modelo ARMAX(p,q), puede adoptar la siguiente forma $$ y_{t} = \beta x_{t} + \phi_{1}y_{t-1} + \cdots + \phi_{p}y_{t-p} + \epsilon_{t} + \theta_{1}\epsilon_{t-1} \cdots + \theta_{q}\epsilon_{t-q} $$ donde el número de nuevos puestos de trabajo y el índice de desarrollo empresarial se denotan por $y_{t}$ y $x_{t}$ respectivamente. Mi referencia en línea favorita para estos modelos es esta Entrada del blog de Rob Hyndman y recomiendo comprobarlo para obtener más detalles (sutilezas).
ARDL
Un modelo ARDL le proporcionaría un marco para explicar el número de nuevos empleos por sus propios rezagos (términos AR) y por los valores contemporáneos y rezagados del índice de desarrollo empresarial. Este tipo de modelo, conocido como modelo ARDL(p,q), puede escribirse de la forma $$ y_{t} = \delta + \sum_{i=1}^{p} \alpha_{i}y_{t-i} + \sum_{j=0}^{q} \beta_{j}x_{t-j} + u_{t} $$ donde $u_{t}$ es un término de error. Como debería ver, es similar a ARMAX - los términos constantes pueden ser incluidos o no.
A efectos de demostración, consideremos un modelo ARDL(1,1) para ver la utilidad potencial de esta clase particular de modelos en el presente contexto. El modelo ARDL(1,1) puede expresarse como sigue $$ y_{t} = \delta + \alpha_{1}y_{t-1} + \beta_{0}x_{t} + \beta_{1}x_{t-1} + u_{t}. $$
Dentro de este modelo hay algunos casos especiales con interpretaciones interesantes. Mencionaré sólo algunos que podrían serte útiles y dejaré una referencia por si quieres buscar los demás. Tenga en cuenta que los casos especiales pueden extenderse al modelo más general ARDL(p,q).
- Regresión estática ( $\alpha_{1} = \beta_{1} = 0$ ): $$y_{t} = \delta + \beta_{0}x_{t} + u_{t}$$
- Modelo de indicador principal ( $\alpha_{1} = \beta_{0} = 0$ ): $$y_{t} = \delta + \beta_{1}x_{t-1} + u_{t}$$
- Modelo de ajuste parcial ( $\beta_{1} = 0$ ): $$y_{t} = \delta + \alpha_{1}y_{t-1} + \beta_{0}x_{t} + u_{t}$$
- Modelo de corrección de errores ( $\beta_{0} + \beta_{1} = 1 - \alpha_{1}$ ): $$\Delta y_{t} = \delta + \beta_{0}\Delta x_{t} + (\alpha_{1}-1)(y_{t-1}-x_{t-1}) + u_{t}$$
OK, así que tenemos un montón de modelos que podría ser útil, pero para construir el modelo empírico se requiere cierta investigación. En otras palabras, para seleccionar un modelo habrá que emplear alguna estrategia.
Obsérvese que la naturaleza anidada del modelo ARDL proporciona un entorno de modelización propicio para la enfoque general a específico de la modelización econométrica de series temporales, que se asocia a David F. Hendry así que hay un lugar donde buscar.
Esperemos que esto haya puesto en marcha su cerebro lo suficiente como para continuar, pero permítame terminar con algunas sugerencias (enumeradas sin ningún orden en particular).
- La función de correlación cruzada (CCF) se puede utilizar para ver si una variable lidera a otra. Descubrir un comportamiento líder ayudaría a justificar un modelo de indicador líder, por ejemplo, pero los datos tendrán que hablar.
- Realiza pruebas de (no) estacionariedad; tanto formales como informales. Parece que tendrá que inducir la estacionariedad (aunque, esto depende; véase el siguiente punto.).
- Pruebe la cointegración si es necesario.
- Utilice las siguientes herramientas del dominio del tiempo para ayudar a identificar la estructura en cada serie temporal: la función de autocorrelación (ACF), la función de autocorrelación parcial (PACF) y la función de autocorrelación residual. Estas herramientas ayudarán a especificar el modelo final y, en este último caso, también a realizar comprobaciones de diagnóstico. Además, observar los datos en niveles no le mostrará muchas de las dinámicas ocultas que estas herramientas pueden poner de manifiesto.
- No descarte la clase de modelos ARIMA, pero considere también otras variables explicativas si tiene motivos para ello.
- Si realmente quieres explicar En el caso de las empresas, considere la posibilidad de utilizar la teoría como guía para construir un modelo econométrico adecuado; ¿son los nuevos puestos de trabajo una función de las tasas de natalidad y mortalidad de las empresas, de las visitas de los turistas, de algo más, etc.?
- Si desea volver a un marco univariante, existen procedimientos automatizados que pueden utilizarse en R para construir tanto modelos ARIMA como ETS.
Basándome en la información proporcionada, es todo lo que puedo decir. Fundamentalmente, habrá que hacer algo de modelado en su nombre. Espero haberte ayudado.
1 votos
Cuando dice "modelar dos series temporales", debería ser más explícito. ¿Intentas predecir una a partir de la otra (cuál a partir de cuál?) o haces algo más?
1 votos
Lo siento - sí, estoy tratando de predecir el Jobs uno del índice. Así que la línea naranja para predecir el azul.