Estoy tomando un curso sobre Econometría de Series Temporales y estoy resolviendo un problema que requiere que los estudiantes escriban explícitamente funciones de máxima verosimilitud para, por ejemplo, procesos AR y los estimen por Máxima Verosimilitud. Estamos obligados a codificar tanto la verosimilitud exacta y la verosimilitud condicional.
Consideremos ahora que se desea estimar un proceso AR(2) de la forma
$y_t = \phi_1 y_{t-1} + \phi_2 y_{t-2} + \epsilon_t $ donde $\epsilon_t \sim N(0, \sigma^2)$
Por lo tanto, buscamos estimaciones de $(\phi_1, \phi_2)$ y $\sigma^2$ . Para codificar una función que tome como entrada los datos $y_t$ y parámetros $(\phi_1, \phi_2, \sigma^2)$ y emite el exacto log-likelihood, he seguido el libro de Hamilton (capítulo 5). La rutina que escribí parece funcionar bien y efectivamente encuentra los estimadores. Mi pregunta es en el lado teórico y sigue.
Para derivar las expresiones del libro de Hamilton, hay que suponer que la DGP que se estima es estacionaria. De lo contrario, las fórmulas no tienen sentido. Pero después de obtener los coeficientes estimados, como comprobación de cordura, calculé las raíces del polinomio AR y descubrí que los coeficientes estimados implican a no estacionario AR(2). Temiendo un error de código, implementé la misma rutina utilizando funciones estándar del statsmodels
paquete en Python encontró que: 1) las estimaciones son similares y 2) el AR(2) implícito también es no estacionario.
Estoy muy confuso. Por un lado, partimos de la hipótesis de que el modelo original es estacionario. Esto nos permite derivar fórmulas claras incluso para la verosimilitud exacta. Por otro lado, el modelo estimado utilizando la verosimilitud exacta derivada de la estacionariedad no es estacionaria. ¿Qué debo hacer? Debo de haber entendido algo muy mal. ¿Alguna idea?
Un último comentario: Propuse otra implementación para la probabilidad exacta en la que mi función Python comprueba, antes de cualquier cálculo, si los valores introducidos para $(\phi_1, \phi_2)$ implican un AR(2) estacionario o no. Si no lo hacen, los resultados de la función $-\infty$ . Cuando optimizo esta función, obtengo estimaciones muy diferentes. Recuerdo que mi profesor decía que los modelos AR(p) no estacionarios, por ejemplo, tienen una representación estacionaria alternativa. Quizá esté encontrando ésta cuando hago esta "pseudoverosimilitud", pero ni siquiera estoy seguro de que esto sea razonable. ¿Alguna idea sobre esto también? Gracias.