TL;DR: Mi serie temporal pasa una prueba ADF con deriva sin tendencia. Entonces, ¿debo dejar mis datos en paz y proceder? ¿O todavía tengo que diferenciarlos antes de modelarlos, porque tienen deriva? ¿O he cometido un error en mi proceso? Me cuesta entender los resultados de mi ADF. Vea los detalles a continuación.
Tengo una serie temporal de 40 observaciones, midiendo los datos mensualmente desde 2002 a 2005. En R:
library(fpp2)
str(insurance[,"TV.advert"])
Quiero hacer una prueba de estacionariedad.
Comienza con pruebas visuales. En primer lugar, trazo en los datos en bruto con una línea de tendencia: Parece bastante estacionario (mucha variación constante), pero hay una ligera tendencia. ¿Se trata de un ciclo? ¿O una tendencia determinista? No estoy seguro.
Entonces, trazo un correlograma de los datos.
Parece ser estacionario: la significación decae bruscamente después del retardo 1. Pero también hay cierta importancia en el retardo 10. Entonces, ¿hay una tendencia o un ciclo? Creo que es ambiguo.
Para despejar cualquier duda, opté por realizar una prueba Dickey-Fuller aumentada (ADF).
library(aTSA)
stationary.test(insurance[,"TV.advert"],
nlag = 13)
En la prueba ADF, hago k = 12 para incluir rezagos para 12 meses del año (en un stationary.test(), para 12 rezagos tengo que hacer k = 13).
En los resultados de la prueba ADF, la serie temporal rechaza la hipótesis nula de un paseo aleatorio con deriva (T) en el lag 0, el lag 1, el lag 9 y el lag 10. Los valores T en los rezagos 0, 1, 9 y 10 (-3,73, -3,64, -4,29 y -3,47) son más negativos que -2,93 (utilizando la tabla "Distribución acumulativa empírica de T" en Box-Steffensmeier et al., 2014, p. 134) y los valores p son < 0,05.
Además, los datos también pasan el ADF en los rezagos 0, 1, 9 y 10 para el "Tipo 3: con deriva y tendencia". Los valores T (-3,758, -3,801, -4,274 y -3,626) son más negativos que 3,50 y los valores p son < 0,05.
Aquí están los resultados:
Augmented Dickey-Fuller Test
alternative: stationary
Type 1: no drift no trend
lag ADF p.value
[1,] 0 -0.3395 0.541
[2,] 1 -0.4569 0.507
[3,] 2 0.0580 0.655
[4,] 3 0.0886 0.663
[5,] 4 -0.0463 0.625
[6,] 5 0.4357 0.763
[7,] 6 0.4857 0.777
[8,] 7 0.6657 0.829
[9,] 8 0.3848 0.748
[10,] 9 0.3560 0.740
[11,] 10 0.3008 0.724
[12,] 11 0.2334 0.705
[13,] 12 0.1393 0.678
Type 2: with drift no trend
lag ADF p.value
[1,] 0 -3.73 0.0100
[2,] 1 -3.64 0.0107
[3,] 2 -2.71 0.0860
[4,] 3 -2.82 0.0702
[5,] 4 -2.19 0.2587
[6,] 5 -1.93 0.3537
[7,] 6 -2.01 0.3274
[8,] 7 -1.87 0.3764
[9,] 8 -2.45 0.1633
[10,] 9 -4.29 0.0100
[11,] 10 -3.47 0.0175
[12,] 11 -1.43 0.5384
[13,] 12 -1.09 0.6563
Type 3: with drift and trend
lag ADF p.value
[1,] 0 -3.758 0.0334
[2,] 1 -3.801 0.0300
[3,] 2 -2.780 0.2615
[4,] 3 -2.867 0.2285
[5,] 4 -2.324 0.4346
[6,] 5 -1.938 0.5866
[7,] 6 -1.978 0.5705
[8,] 7 -1.816 0.6362
[9,] 8 -2.391 0.4090
[10,] 9 -4.274 0.0100
[11,] 10 -3.626 0.0437
[12,] 11 -0.953 0.9332
[13,] 12 -0.020 0.9900
----
Note: in fact, p.value = 0.01 means p.value <= 0.01
Ahora, no tengo claro qué hacer.
En la mayoría de los ejemplos que veo, las series temporales fallan en todas las pruebas ADF, por lo que hay que diferenciarlas.
Como he pasado el ADF "Tipo 2 con deriva sin tendencia", ¿dejo la serie temporal en paz? ¿O todavía tengo que diferenciarla, porque tiene deriva?