22 votos

Que Dickey-Fuller prueba debo aplicar para una serie de tiempo con un modelo subyacente que incluye un intercepto de la deriva plazo y un tiempo lineal de la tendencia?

Versión corta:

Tengo una serie de tiempo de datos de clima que estoy de pruebas de estacionariedad. Con base en investigaciones anteriores, espero que el modelo subyacente (o "generar", por así decirlo) los datos para tener un término de intersección y positivo, el tiempo lineal de la tendencia. Para probar estos datos para la estacionariedad, se debe utilizar el de Dickey-Fuller de prueba que incluye un intercepto y tendencia del tiempo, es decir, la ecuación #3?

$\nabla y_t = \alpha_0+\alpha_1t+\delta y_{t-1}+u_t$

O, debo usar el DF prueba de que sólo incluye una intercepción porque la primera diferencia de la ecuación creo que subyace en el modelo sólo tiene una intersección?

Versión larga:

Como se indicó anteriormente, tengo una serie de tiempo de datos de clima que estoy de pruebas de estacionariedad. Con base en investigaciones anteriores, espero que el modelo subyacente en los datos para tener un término de intersección, una lineal positiva tendencia del tiempo, y algunos se distribuye normalmente término de error. En otras palabras, espero que el modelo subyacente a ser algo como esto:

$y_t = a_0 + a_1t + \beta y_{t-1} + u_t $

donde $u_t$ se distribuye normalmente. Desde que estoy suponiendo que el modelo subyacente tiene tanto una intercepción y un tiempo lineal de la tendencia, he probado de una unidad de raíz con la ecuación #3 de la simple Dickey-Fuller de prueba, como se muestra:

$\nabla y_t = \alpha_0+\alpha_1t+\delta y_{t-1}+u_t$

Esta prueba devuelve un valor crítico que me llevaría a rechazar la hipótesis nula y concluir que el modelo subyacente es no estacionaria. Sin embargo, me pregunta si estoy aplicando esto correctamente, debido a que aunque el modelo subyacente se supone que tiene un intercepto y tendencia del tiempo, esto no implica que la primera diferencia $\nabla y_t$ será así. Muy al contrario, de hecho, si mis matemáticas son correctas.

El cálculo de la primera diferencia que se basa en la ecuación de la supuesta modelo subyacente da: $\nabla y_t = y_t - y_{t-1} = [a_0 + a_1t + \beta y_{t-1} + u_t] - [a_0 + a_1(t-1) + \beta y_{t-2} + u_{t-1}]$

$\nabla y_t = [a_0 - a_0] + [a_1t - a_t(t-1)] + \beta[y_{t-1} - y_{t-2}] + [u_t - u_{t-1}]$

$\nabla y_t = a_1 + \beta \cdot \nabla y_{t-1} + u_t - u_{t-1}$

Por lo tanto, la primera diferencia $\nabla y_t$ parece que sólo tienen una intersección, no una tendencia.

Creo que mi pregunta es similar a este, excepto que yo no estoy seguro de cómo aplicar la respuesta a mi pregunta.

Datos de ejemplo:

He aquí algunos de la temperatura de la muestra de datos en la que estoy trabajando.

64.19749  
65.19011  
64.03281  
64.99111  
65.43837  
65.51817  
65.22061  
65.43191  
65.0221  
65.44038  
64.41756  
64.65764  
64.7486  
65.11544  
64.12437  
64.49148  
64.89215  
64.72688  
64.97553  
64.6361  
64.29038  
65.31076  
64.2114  
65.37864  
65.49637  
65.3289  
65.38394  
65.39384  
65.0984  
65.32695  
65.28  
64.31041  
65.20193  
65.78063  
65.17604  
66.16412  
65.85091  
65.46718  
65.75551  
65.39994  
66.36175  
65.37125  
65.77763  
65.48623  
64.62135  
65.77237  
65.84289  
65.80289  
66.78865  
65.56931  
65.29913  
64.85516  
65.56866  
64.75768  
65.95956  
65.64745  
64.77283  
65.64165  
66.64309  
65.84163  
66.2946  
66.10482  
65.72736  
65.56701  
65.11096  
66.0006  
66.71783  
65.35595  
66.44798  
65.74924  
65.4501  
65.97633  
65.32825  
65.7741  
65.76783  
65.88689  
65.88939  
65.16927  
64.95984  
66.02226  
66.79225  
66.75573  
65.74074  
66.14969  
66.15687  
65.81199  
66.13094  
66.13194  
65.82172  
66.14661  
65.32756  
66.3979  
65.84383  
65.55329  
65.68398  
66.42857  
65.82402  
66.01003  
66.25157  
65.82142  
66.08791  
65.78863  
66.2764  
66.00948  
66.26236  
65.40246  
65.40166  
65.37064  
65.73147  
65.32708  
65.84894  
65.82043  
64.91447  
65.81062  
66.42228  
66.0316  
65.35361  
66.46407  
66.41045  
65.81548  
65.06059  
66.25414  
65.69747  
65.15275  
65.50985  
66.66216  
66.88095  
65.81281  
66.15546  
66.40939  
65.94115  
65.98144  
66.13243  
66.89761  
66.95423  
65.63435  
66.05837  
66.71114 

23voto

Jamie Brennan Puntos 86

Usted necesita considerar la deriva y (paramétrico/lineal) tendencia en los niveles de la serie de tiempo con el fin de especificar los términos deterministas en la de Dickey-Fuller aumentado de regresión, que es en términos de las primeras diferencias de la serie de tiempo. La confusión surge exactamente de la derivada de la primera ecuación de diferencias en la forma en que usted lo ha hecho.

(Aumentada) de Dickey-Fuller modelo de regresión

Supongamos que los niveles de la serie incluyen a la deriva y con tendencia plazo $$ Y_t = \beta_{0,l} + \beta_{1,l} t + \beta_{2, l}Y_{t-1} + \varepsilon_{t} $$ La hipótesis nula de no estacionariedad en este caso sería la $\mathfrak{H}_0{}:{}\beta_{2, l} = 1$.

Una ecuación para la primera de las diferencias implícitas en este tipo de datos-proceso de generación de [DGP], es el que se haya derivado $$ \Delta Y_t = \beta_{1,l} + \beta_{2, l}\Delta Y_{t-1} + \Delta \varepsilon_{t} $$ Sin embargo, este no es el (aumentada) de Dickey Fuller de regresión como el utilizado en la prueba.

En cambio, la versión correcta puede ser tenido por restando $Y_{t-1}$ desde ambos lados de la primera ecuación resultante en $$ \begin{align} \Delta Y_t &= \beta_{0,l} + \beta_{1,l} t + (\beta_{2, l}-1)Y_{t-1} + \varepsilon_{t} \\ &\equiv \beta_{0,d} + \beta_{1,d}t + \beta_{2,d}Y_{t-1} + \varepsilon_{t} \end{align} $$ Este es el (aumentada) de Dickey-Fuller de regresión, y la versión equivalente de la hipótesis nula de no estacionariedad es la prueba de $\mathfrak{H}_0{}:{}\beta_{2, d}=0$ que es sólo una prueba de t mediante la estimación OLS de $\beta_{2, d}$ en la regresión anterior. Tenga en cuenta que la evolución y tendencia de venir a esta especificación sin cambios.

Un punto adicional a tener en cuenta es que si usted no está seguro acerca de la presencia de la tendencia lineal en los niveles de las series de tiempo, entonces usted puede conjunta de la prueba para la tendencia lineal y la unidad de la raíz, que es, $\mathfrak{H}_0{}:{}[\beta_{2, d}, \beta_{1,l}]' = [0, 0]'$, que puede ser probado mediante una prueba F con adecuados valores críticos. Estas pruebas y los valores críticos son producidos por la función R ur.df en la urca paquete.

Veamos algunos ejemplos en detalle.

Ejemplos

1. Utilizando la inversión de la serie

El primer ejemplo utiliza las inversiones de EE.UU. de la serie, el cual es discutido en Lutkepohl y Kratzig (2005, pg. 9). La trama de la serie y su primera diferencia que se dan a continuación.

enter image description here

A partir de los niveles de la serie, parece que tiene una media distinta de cero, pero no parece haber una tendencia lineal. Así, se procede con una aumentada de Dickey Fuller de regresión con una intercepción, y también tres rezagos de la variable dependiente para dar cuenta de la correlación serial, que es: $$ \Delta Y_t = \beta_{0,d} + \beta_{2,d}Y_{t-1} + \sum_{j=1}^3 \gamma_j \Delta Y_{t j} + \varepsilon_{t} $$ Nota el punto clave que me han mirado los niveles para especificar la ecuación de regresión en diferencias.

El código R para hacer esto es la siguiente:

    library(urca)
    library(foreign)
    library(zoo)

    tsInv <- as.zoo(ts(as.data.frame(read.table(
      "http://www.jmulti.de/download/datasets/US_investment.dat", skip=8, header=TRUE)), 
                       frequency=4, start=1947+2/4))
    png("USinvPlot.png", width=6,
        height=7, units="in", res=100)
    par(mfrow=c(2, 1))
    plot(tsInv$USinvestment)
        plot(diff(tsInv$USinvestment))
    dev.off()

    # ADF with intercept
    adfIntercept <- ur.df(tsInv$USinvestment, lags = 3, type= 'drift')
    summary(adfIntercept)

Los resultados indican que la hipótesis nula de no estacionariedad puede ser rechazado por esta serie utilizando la prueba de t en base a la estimación del coeficiente. El conjunto de prueba F de la intersección y el coeficiente de la pendiente ($\mathfrak{H}{}:{}[\beta_{2, d}, \beta_{0,l}]' = [0, 0]'$) también se rechaza la hipótesis nula de que no hay una unidad de la raíz en la serie.

2. El uso del alemán (registro) el consumo de la serie

El segundo ejemplo es el uso de la alemana trimestral desestacionalizado de la serie de tiempo de (log) de consumo. La trama de la serie y sus diferencias se dan a continuación.

enter image description here

A partir de los niveles de la serie, está claro que la serie tiene una tendencia, por lo que incluimos la tendencia en el de Dickey-Fuller aumentado de regresión junto con cuatro rezagos de las primeras diferencias para dar cuenta de la correlación serial, que es $$ \Delta Y_t = \beta_{0,d} + \beta_{1,d}t + \beta_{2,d}Y_{t-1} + \sum_{j=1}^4 \gamma_j \Delta Y_{t j} + \varepsilon_{t} $$

The R code to do this is

# using the (log) consumption series
tsConsump <- zoo(read.dta("http://www.stata-press.com/data/r12/lutkepohl2.dta"), frequency=1)
png("logConsPlot.png", width=6,
    height=7, units="in", res=100)
par(mfrow=c(2, 1))
plot(tsConsump$ln_consump)
    plot(diff(tsConsump$ln_consump))
dev.off()

# ADF with trend
adfTrend <- ur.df(tsConsump$ln_consump, lags = 4, type = 'trend')
summary(adfTrend)

The results indicate that the null of nonstationarity cannot be rejected using the t-test based on the estimated coefficient. The joint F-test of the linear trend coefficient and the slope coefficient ($\mathfrak{H}{}:{}[\beta_{2, d}, \beta_{1,l}]' = [0, 0]'$) también indica que la nula de no estacionariedad no puede ser rechazada.

3. El uso dado a los datos de temperatura

Ahora podemos evaluar las propiedades de los datos. La costumbre de parcelas en niveles y primeras diferencias se dan a continuación.

enter image description here

Estos indican que los datos tienen una intercepción y una tendencia, por lo que realizamos la prueba ADF (sin quedado a la primera diferencia de los términos), utilizando el siguiente código R

# using the given data
tsTemp <- read.table(textConnection("temp 
64.19749  
65.19011  
64.03281  
64.99111  
65.43837  
65.51817  
65.22061  
65.43191  
65.0221  
65.44038  
64.41756  
64.65764  
64.7486  
65.11544  
64.12437  
64.49148  
64.89215  
64.72688  
64.97553  
64.6361  
64.29038  
65.31076  
64.2114  
65.37864  
65.49637  
65.3289  
65.38394  
65.39384  
65.0984  
65.32695  
65.28  
64.31041  
65.20193  
65.78063  
65.17604  
66.16412  
65.85091  
65.46718  
65.75551  
65.39994  
66.36175  
65.37125  
65.77763  
65.48623  
64.62135  
65.77237  
65.84289  
65.80289  
66.78865  
65.56931  
65.29913  
64.85516  
65.56866  
64.75768  
65.95956  
65.64745  
64.77283  
65.64165  
66.64309  
65.84163  
66.2946  
66.10482  
65.72736  
65.56701  
65.11096  
66.0006  
66.71783  
65.35595  
66.44798  
65.74924  
65.4501  
65.97633  
65.32825  
65.7741  
65.76783  
65.88689  
65.88939  
65.16927  
64.95984  
66.02226  
66.79225  
66.75573  
65.74074  
66.14969  
66.15687  
65.81199  
66.13094  
66.13194  
65.82172  
66.14661  
65.32756  
66.3979  
65.84383  
65.55329  
65.68398  
66.42857  
65.82402  
66.01003  
66.25157  
65.82142  
66.08791  
65.78863  
66.2764  
66.00948  
66.26236  
65.40246  
65.40166  
65.37064  
65.73147  
65.32708  
65.84894  
65.82043  
64.91447  
65.81062  
66.42228  
66.0316  
65.35361  
66.46407  
66.41045  
65.81548  
65.06059  
66.25414  
65.69747  
65.15275  
65.50985  
66.66216  
66.88095  
65.81281  
66.15546  
66.40939  
65.94115  
65.98144  
66.13243  
66.89761  
66.95423  
65.63435  
66.05837  
66.71114"), header=T)
tsTemp <- as.zoo(ts(tsTemp, frequency=1))

png("tempPlot.png", width=6,
    height=7, units="in", res=100)
par(mfrow=c(2, 1))
plot(tsTemp$temp)
    plot(diff(tsTemp$temp))
dev.off()

# ADF with trend
adfTrend <- ur.df(tsTemp$temp, type = 'trend')
summary(adfTrend)

Los resultados para ambos la prueba de t y el F-test indican que la nula de no estacionariedad puede ser rechazada por la temperatura de la serie. Espero que aclara el asunto un poco.

0voto

Marc-Andre R. Puntos 789

La hipótesis nula en Dickey-Fuller prueba es que hay una unidad de la raíz en un proceso. Así que cuando usted rechazar el nulo, se obtiene que el proceso es estacionario (con las habituales advertencias de la prueba de hipótesis).

Respecto a las matemáticas, la expresión $$\nabla y_t=\alpha_0+\alpha_1 t+\delta y_{t-1}+u_t$$

no significa que $\nabla y_t$ tiene una tendencia. Para decir que el proceso tiene una tendencia, su definición debe incluir sólo ese proceso. En la ecuación anterior ha $\nabla y_t$ por un lado, y $y_{t-1}$ en otros. Cuando expresas $y_{t-1}$ en términos de $\nabla y_{t-1}$ correctamente llegado a la conclusión de que no hay ninguna tendencia en el diferenciadas proceso, si el proceso es estacionario.

0voto

Bu Wenliang Puntos 21

Las anteriores respuestas fueron excelentes.

Por lo general toma la decisión de que una prueba para implementar basado en la trama. En este caso, los datos parecen tener un intercepto y tendencia.

Si se prueba que una Unidad de la Raíz en los niveles, tendrás que usar una intercepción y el modelo de tendencia. Si ejecuta la prueba en las diferencias, vamos a usar sólo una intercepción modelo.

Me acaba de responder a esta pregunta porque tengo que recomendar el uso estacional de las pruebas en este tipo de datos. Estas pruebas son realmente complejos, que trabaja con la estacionalidad no es fácil). Sin embargo, la naturaleza de los datos (temperatura) y debido a que en el gráfico se puede observar algún comportamiento estacional. Entonces, usted debe investigar en HEGY probar y poner en práctica si desea que sus estimaciones para ser robusto.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X