No importa si se formula la regresión Dickey-Fuller con $y_t$ o $\Delta y_t$ en el lado izquierdo. La página web $t$ -Estadística es exactamente lo mismo. Es una cuestión de preferencia. (La segunda formulación parece más común).
Primera regresión
La regresión Dickey-Fuller $$ y_t = \gamma y_{t-1} + \epsilon_t, $$ no es robusto con respecto a la correlación serial en el término de error $\{ \epsilon_t \}$ .
El aumento de la regresión con términos retardados se debe a un intento de controlar dicha correlación serial, concretamente en el caso de que el término de error siga un proceso ARMA.
Supongamos que $\epsilon_t$ sigue una especificación ARMA(1,1): $$ y_t = \gamma y_{t-1} + \epsilon_t, $$ donde $$ (1 - \phi L) \epsilon_t = (1 - \theta L) \nu_t. $$ $L$ es el operador de retardo y $\{ \nu_t\}$ es ruido blanco.
La representación MA invertida de $\epsilon_t$ $$ \nu_t = (1 - \theta L)^{-1} (1 - \phi L) \epsilon_t = \sum_{h = 0} \psi_h \epsilon_{t-h} $$ implica $$ \epsilon_t = \psi_1 \epsilon_{t-1} + \psi_2 \epsilon_{t-2} + \cdots + \nu_t. $$ Sustituyendo de nuevo en el modelo, $$ y_t = \gamma y_{t-1} + \psi_1 \epsilon_{t-1} + \psi_2 \epsilon_{t-2} + \cdots + \nu_t. $$ Bajo la raíz unitaria nula $H_0: \gamma = 1$ , $\epsilon_t = \Delta y_t$ . Así, el modelo de regresión se convierte (con tendencia lineal) en $$ y_t = \alpha + \beta t + \gamma_1 y_{t-1} + \psi_1 \Delta y_{t-1} + \psi_2 \Delta y_{t-2} + \cdots + \nu_t. $$ El estadístico Dickey-Fuller es el $t$ estadística para las pruebas $H_0: \gamma_1 = 1$ .
Segunda regresión
Restando $y_{t-1}$ de ambos lados, $$ \Delta y_t = \alpha + \beta t + \gamma_2 y_{t-1} + \psi_1 \Delta y_{t-1} + \psi_2 \Delta y_{t-2} + \cdots + \nu_t. $$ El estadístico Dickey-Fuller es el $t$ estadística para las pruebas $H_0: \gamma_2 = 0$ .
El álgebra de regresión simple te dice que $\hat{\gamma}_2 = \hat{\gamma}_1 -1$ . Además, los errores estándar son los mismos: estas dos regresiones tienen los mismos residuos y regresores. Esto implica que los errores estándar de $\hat{\gamma}_2$ y $\hat{\gamma}_1$ son los mismos. Así que el $t$ -Estadística es la misma.