Tengo dos series temporales (parámetros de un modelo para hombres y mujeres) y pretendo identificar un modelo ARIMA adecuado para hacer previsiones. Mi serie temporal tiene el siguiente aspecto
El gráfico y el ACF se muestran no estacionarios (los picos del ACF se cortan muy lentamente). Así, utilizo la diferenciación y obtengo:
Este gráfico indica que la serie podría ser ahora estacionaria y la aplicación de la prueba kpss y la prueba adf apoyan esta hipótesis.
Empezando por la serie masculina, hacemos las siguientes observaciones:
- Las autocorrelaciones empíricas en los rezagos 1,4,5,26 y 27 son significativamente diferentes de cero.
- El ACF se corta (?), pero me preocupan los picos relativamente grandes en los lag 26 y 27.
- Sólo las autocorrelaciones parciales empíricas en los rezagos 1 y 2 son significativamente diferentes de cero.
Sólo por estas observaciones, si tuviera que elegir un modelo AR o MA puro para las series temporales diferenciadas, me inclinaría por un modelo AR(2) argumentando que:
- No tenemos autocorrelaciones parciales significativas para un retardo superior a 2
- El ACF se corta excepto en la región alrededor del lag 27. (¿Son estos pocos valores atípicos por sí solos un indicador de que un modelo ARMA mixto sería apropiado?)
o un modelo MA(1) argumentando que:
- El PACF corta claramente
- Tenemos para rezagos superiores a 1 sólo 4 picos que superan el valor crítico en magnitud. Esto es "sólo" uno más que los 3 picos (95% de 60) que se permitirían estar fuera del área punteada.
No hay características de un modelo ARIMA(1,1,1) y la elección de los órdenes de p y q de un modelo ARIMA sobre la base de ACF y PACF para p+q > 2 se hace difícil.
Utilizando auto.arima() con el criterio AIC (¿Debo utilizar AIC o AICC?) da:
- ARIMA(2,1,1) con deriva; AIC=280,2783
- ARIMA(0,1,1) con deriva; AIC=280,2784
- ARIMA(2,1,0) con deriva; AIC=281,437
Los tres modelos considerados muestran residuos de ruido blanco:
Mis preguntas resumidas son:
- ¿Se puede seguir describiendo la ACF de la serie temporal como corte de a pesar de los picos alrededor del lag 26?
- ¿Son estos valores atípicos un indicador de que un modelo ARMA mixto podría ser más apropiado?
- ¿Qué criterio de información debo elegir? ¿AIC? ¿AICC?
- Los residuos de los tres modelos con el AIC más alto muestran un comportamiento de ruido blanco, pero la diferencia en el AIC es muy pequeña. ¿Debo utilizar el que tenga menos parámetros, es decir, un ARIMA(0,1,1)?
- ¿Es mi argumentación en general plausible?
- ¿Existen otras posibilidades para determinar qué modelo podría ser mejor o debería, por ejemplo, elegir los dos con el AIC más alto y realizar pruebas retrospectivas para comprobar la plausibilidad de las previsiones?
EDITAR: Aquí están mis datos:
-5.9112948202 -5.3429985122 -4.7382340534 -3.1129015623 -3.0350910288 -2.3218904871 -1.7926701792 -1.1417358384 -0.6665592055 -0.2907748318 0.2899480865 0.4637205370 0.5826312749 0.3869227286 0.6268379174 0.7439125292 0.7641139207 0.7613140511 3.0143912244 -0.7339255839 2.0109976796 0.8282394650 -2.5668367983 5.9826406394 1.9569198553 2.3860893476 2.0883339390 1.9761894580 2.2601997245 2.2464027995 2.5131158613 3.4564765529 4.2307335557 4.0298688374 3.7626317439 3.1026407174 2.1690168737 1.5617407254 2.6790460788 0.4652054768 -0.0501046517 -1.0157683791 -0.5113698054 -0.0180401353 -1.9471272198 -0.2550365250 -1.1269988523 0.5152074134 0.2362626753 -2.9978337017 1.4924705528 -1.4907767844 -0.5492041416 -0.7313021018 -0.6531515868 -0.4094159299 -0.5525401626 -0.0611454515 -0.5256272882 -1.1235247363 -1.7299848758 -1.3807763611 -1.6999054476 -4.3155973110 -4.7843298990