Tengo datos climáticos mensuales de 90 años. Armé el mejor modelo que pude (agregué parámetros sensibles para minimizar el AIC), y luego probé varias estructuras de correlación ARMA (usando gls
en el paquete lmne en R) para reducir los rezagos pequeños (<30) significativos. A continuación, seleccioné el modelo ARMA con el AIC más bajo como mejor modelo.
Sin embargo, según los gráficos ACF y PACF, sigue habiendo rezagos significativos de intervalos mayores (>30).
Mis preguntas son:
-
¿Cómo debo reaccionar ante eso? ¿Las considero importantes o espurias?
- Inicialmente supuse que si el lag 60 (asociado a 5 años) era significativo, entonces esto indicaría que hay una tendencia de 5 años en mis datos. Sin embargo, me pareció escuchar antes que ACF/PACF no es una buena manera de abordar los rezagos a largo plazo.
-
¿Qué hago con esto? ¿Cómo puedo reducir los retrasos más grandes?
-
Por ejemplo, ¿existe una combinación específica de ARMA p/q que reduzca "mejor" los rezagos más grandes? ¿O debería intentar añadir variables sin/cos en mi modelo? ¿O algún otro enfoque?
-
De nuevo, si el ACF/PACF no es bueno para identificar los grandes rezagos, ¿cómo podría determinar los patrones cíclicos "reales" a largo plazo para tener en cuenta?
-
1 votos
No me preocupan estos desfases, son correlaciones benignas.
3 votos
Estoy de acuerdo con @Aksakal, además, fíjate que 6 de los 120 PACs están más allá de los límites del 95%, que es exactamente lo que se esperaría de los "valores verdaderos" de 0 con error de muestreo. Un poco más difícil de decir con el ACF, pero parece que tal vez 5-8 están más allá de los límites del 95%, que es también más o menos lo que cabría esperar de "valores verdaderos" de 0.