Tengo una serie temporal que intento predecir, para la que he utilizado el modelo estacional ARIMA(0,0,0)(0,1,0)[12] (=fit2). Es diferente de lo que R sugirió con auto.arima (R calculó que ARIMA(0,1,1)(0,1,0)[12] sería un mejor ajuste, lo llamé fit1). Sin embargo, en los últimos 12 meses de mi serie temporal mi modelo (fit2) parece ajustarse mejor (estaba crónicamente sesgado, he añadido la media residual y el nuevo ajuste parece ajustarse mejor a la serie temporal original. Aquí está el ejemplo de los últimos 12 meses y MAPE para los 12 meses más recientes para ambos ajustes:
La serie temporal tiene este aspecto:
Hasta aquí todo bien. He realizado el análisis residual para ambos modelos, y aquí está la confusión.
El acf(resid(fit1)) se ve muy bien, con mucho ruido blanco:
Sin embargo, la prueba de Ljung-Box no parece buena para , por ejemplo, 20 rezagos:
Box.test(resid(fit1),type="Ljung",lag=20,fitdf=1)
Obtengo los siguientes resultados:
X-squared = 26.8511, df = 19, p-value = 0.1082
A mi entender, esta es la confirmación de que los residuos no son independientes (el valor p es demasiado grande para mantener la hipótesis de independencia).
Sin embargo, para el lag 1 todo es genial:
Box.test(resid(fit1),type="Ljung",lag=1,fitdf=1)
me da el resultado:
X-squared = 0.3512, df = 0, p-value < 2.2e-16
O no estoy entendiendo la prueba, o se contradice ligeramente con lo que veo en el gráfico acf. La autocorrelación es ridículamente baja.
Luego comprobé fit2. La función de autocorrelación se ve así:
A pesar de una autocorrelación tan obvia en varios primeros rezagos, la prueba de Ljung-Box me dio resultados mucho mejores a 20 rezagos, que fit1:
Box.test(resid(fit2),type="Ljung",lag=20,fitdf=0)
resulta en :
X-squared = 147.4062, df = 20, p-value < 2.2e-16
mientras que la simple comprobación de la autocorrelación en el retardo 1 también me confirma la hipótesis nula.
Box.test(resid(arima2.fit),type="Ljung",lag=1,fitdf=0)
X-squared = 30.8958, df = 1, p-value = 2.723e-08
¿He entendido bien la prueba? El valor p debe ser preferiblemente inferior a 0,05 para confirmar la hipótesis nula de independencia de los residuos. ¿Qué ajuste es mejor utilizar para la previsión, fit1 o fit2?
Información adicional: los residuos de fit1 muestran una distribución normal, los de fit2 no.