16 votos

La comprensión de los k lag en R aumentada de Dickey Fuller prueba

He jugado con algunos de la unidad de pruebas de raíz en R y no estoy del todo seguro de qué hacer con el k retraso parámetro. He utilizado el augmented Dickey Fuller prueba y la Philipps Perron prueba de la tseries paquete. Obviamente el valor predeterminado $k$ parámetro (para el adf.test) sólo depende de la longitud de la serie. Si puedo elegir diferentes $k$-valores que ser bastante diferentes resultados wrt. rechazar la nula:

Dickey-Fuller = -3.9828, Lag order = 4, p-value = 0.01272
alternative hypothesis: stationary 
# 103^(1/3)=k=4 


Dickey-Fuller = -2.7776, Lag order = 0, p-value = 0.2543
alternative hypothesis: stationary
# k=0

Dickey-Fuller = -2.5365, Lag order = 6, p-value = 0.3542
alternative hypothesis: stationary
# k=6

además el PP el resultado de la prueba:

Dickey-Fuller Z(alpha) = -18.1799, Truncation lag parameter = 4, p-value = 0.08954
alternative hypothesis: stationary 

Mirando los datos, yo creo que los datos subyacentes es no estacionaria, pero aún así no considero a estos resultados un fuerte copia de seguridad, en particular debido a que no entiendo el papel de la $k$ parámetro. Si miro a descomponer / stl veo que la tendencia tiene un fuerte impacto frente a sólo un pequeño aporte de resto o variación estacional. Mi serie es de frecuencia trimestral.

Cualquier sugerencias?

6voto

Alp Puntos 446

Ha sido un tiempo desde que he mirado ADF pruebas, sin embargo, que yo recuerde, al menos, dos versiones de la prueba adf.

http://www.stat.ucl.ac.be/ISdidactique/Rhelp/library/tseries/html/adf.test.html

http://cran.r-project.org/web/packages/fUnitRoots/

El fUnitRoots paquete tiene una función llamada adfTest(). Creo que la "tendencia" de tema es tratado de manera diferente en los paquetes.

Editar \begin{align} \int_0^\infty xe^{-ax^2}\,\mathrm{d}x &=\frac12\int_0^\infty\overbrace{\ e^{-ax^2}\ }^{\large u}\,\overbrace{\ \ \mathrm{d}x^2\ \ \vphantom{e^{-ax^2}}}^{\large\mathrm{d}v}\\ &=\frac12\left[x^2e^{-ax^2}\right]_0^\infty-\frac12\int_0^\infty\overbrace{\ \ \ x^2\ \ \ \vphantom{\mathrm{d}e^{-ax^2}}}^{\large v}\,\overbrace{\mathrm{d}e^{-ax^2}}^{\large\mathrm{d}u}\\[9pt] &=a\int_0^\infty x^3e^{-ax^2}\,\mathrm{d}x \end- a partir De la página 14 del siguiente enlace, hay 4 versiones (uroot descontinuado) de la prueba adf:

http://math.uncc.edu/~zcai/FinTS.pdf

Un eslabón más. Lea la sección 6.3 en el siguiente enlace. Hace mucho btter trabajo de lo que yo podría hacer en la explicación de los gal plazo:

http://www.yats.com/doc/cointegration-en.html

También, podría ser cuidadoso con cualquier temporada del modelo. A menos que estés seguro de que hay cierta estacionalidad presente, me gustaría evitar el uso estacional de los términos. Por qué? Cualquier cosa puede ser descompuesto en temporada términos, incluso si no lo es. He aquí dos ejemplos:

#First example: White noise
x <- rnorm(200)

#Use stl() to separate the trend and seasonal term
x.ts <- ts(x, freq=4) 
x.stl <- stl(x.ts, s.window = "periodic")
plot(x.stl)

#Use decompose() to separate the trend and seasonal term
x.dec <- decompose(x.ts)
plot(x.dec)

#===========================================

#Second example, MA process
x1 <- cumsum(x)

#Use stl() to separate the trend and seasonal term
x1.ts <- ts(x1, freq=4)
x1.stl <- stl(x1.ts, s.window = "periodic")
plot(x1.stl)

#Use decompose() to separate the trend and seasonal term
x1.dec <- decompose(x1.ts)
plot(x1.dec)

El gráfico de abajo es de la anterior plot(x.stl) de la declaración. stl() encontró una pequeña temporada plazo en ruido blanco. Se podría decir que el término es tan pequeña que no es realmente un problema. El problema es que en datos reales, no sabes si ese término es un problema o no. En el ejemplo a continuación, observe que la tendencia de las series de datos de los segmentos donde se ve como una versión filtrada de los datos en bruto, y otros segmentos en los que podría considerarse significativamente diferentes de los datos en bruto.

enter image description here

2voto

jsumners Puntos 290

El parámetro k es un conjunto de retardos que se añade a la dirección de la correlación serial. La Una en ADF significa que la prueba es aumentada por la adición de los gal. La selección del número de rezagos en el alimentador automático de documentos puede hacer una variedad de maneras. Una forma común es comenzar con un gran número de los gal seleccionados a priori y reducir el número de retardos de forma secuencial hasta la más larga de retraso es estadísticamente significativa.

Usted puede probar la correlación serial en los residuos después de la aplicación de los gal en el alimentador automático de documentos.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X