18 votos

Confusión con la prueba Dickey Fuller aumentada

Estoy trabajando en el conjunto de datos electricity disponible en el paquete R TSA . Mi objetivo es averiguar si un arima modelo será apropiado para estos datos y, finalmente, se ajustará a ellos. Así que procedí de la siguiente manera:

1er: Traza la serie temporal que da como resultado el siguiente gráfico: ts plot1

2º: Quería llevar el registro de electricity para estabilizar la varianza y después diferencié las series como correspondía, pero justo antes de hacerlo, comprobé la estacionariedad en el conjunto de datos original utilizando el método adf (Augmented Dickey Fuller) y, sorprendentemente, resultó lo siguiente:

Código y resultados:

adf.test(electricity)

             Augmented Dickey-Fuller Test
data:  electricity 
Dickey-Fuller = -9.6336, Lag order = 7, p-value = 0.01 
alternative hypothesis: stationary
Warning message: In adf.test(electricity) : p-value smaller than printed p-value

Bueno, según mi noción de principiante de las series temporales, supongo que significa que los datos son estacionarios (valor p pequeño, rechaza la hipótesis nula de no estacionariedad). Pero mirando el gráfico ts, no encuentro forma de que esto pueda ser estacionario. ¿Alguien tiene una explicación válida para esto?

16voto

horaceT Puntos 170

Dado que se toma el valor por defecto de k en adf.test que en este caso es 7, básicamente estás probando si el conjunto de información de los últimos 7 meses ayuda a explicar $x_t - x_{t-1}$ . El uso de la electricidad tiene una fuerte estacionalidad, como muestra su gráfico, y es probable que sea cíclico más allá de un periodo de 7 meses. Si establece k=12 y vuelve a realizar la prueba, no se puede rechazar la nulidad de raíz unitaria,

> adf.test(electricity, k=12)

Augmented Dickey-Fuller Test
data:  electricity
Dickey-Fuller = -1.9414, Lag order = 12, p-value = 0.602
alternative hypothesis: stationary

3voto

Sylvain Puntos 16

Suponiendo que "adf.test" proceda realmente del paquete "tseries" (directa o indirectamente), la razón sería que incluye automáticamente una tendencia temporal lineal. Del documento tseries (versión 0.10-35): "Se utiliza la ecuación de regresión general que incorpora una constante y una tendencia lineal [...]" Así que el resultado de la prueba indica efectivamente estacionariedad de la tendencia (que a pesar del nombre no es estacionaria).

También estoy de acuerdo con Pantera en que los efectos estacionales podrían distorsionar el resultado. La serie podría ser en realidad una tendencia temporal + estacionales deterministas + proceso estocástico de raíz unitaria, pero la prueba ADF podría interpretar erróneamente las fluctuaciones estacionales como reversiones estocásticas a la tendencia determinista, lo que implicaría raíces menores que la unidad. (Por otra parte, dado que ha incluido suficientes rezagos, esto debería aparecer más bien como raíces unitarias (espurias) en las frecuencias estacionales, no en la frecuencia cero/de largo plazo que examina la prueba ADF. En cualquier caso, dado el patrón estacional es mejor incluir los estacionales).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X