He escrito un código que puede hacer el filtrado de Kalman (utilizando un número de diferentes filtros de tipo Kalman [Filtro de información y otros]) para el análisis del espacio de estado gaussiano lineal para un vector de estado n-dimensional. Los filtros funcionan muy bien y estoy obteniendo unos buenos resultados. Sin embargo, la estimación de los parámetros a través de la estimación de loglikelihood me confunde. No soy un estadístico sino un físico, así que por favor sea amable.
Consideremos el modelo de espacio de estado gaussiano lineal
$$y_t = \mathbf{Z}_{t}\alpha_{t} + \epsilon_{t},$$ $$\alpha_{t + 1} = \mathbf{T}_{t}\alpha_{t} + \mathbf{R}_{t}\eta_{t},$$
donde $y_{t}$ es nuestro vector de observación, $\alpha_{t}$ nuestro vector de estado en el paso de tiempo $t$ . Las cantidades en negrita son las matrices de transformación del modelo de espacio de estados que se establecen en función de las características del sistema considerado. También tenemos
$$\epsilon_{t} \sim NID(0, \mathbf{H}_{t}),$$ $$\eta_{t} \sim NID(0, \mathbf{Q}_{t}),$$ $$\alpha_{1} \sim NID(a_{1}, \mathbf{P}_{1}).$$
donde $t = 1,\ldots, n$ . Ahora, he derivado e implementado la recursión para el filtro de Kalman para este modelo genérico de espacio de estados adivinando los parámetros iniciales y las matrices de varianza $\mathbf{H}_{1}$ y $\mathbf{Q}_{1}$ Puedo producir parcelas como
donde los puntos son los niveles de agua del río Nilo para Jan de más de 100 años, la línea es el estado estimado de Kalamn y las líneas discontinuas son los niveles de confianza del 90%.
Ahora, para este conjunto de datos 1D las matrices $\mathbf{H}_{t}$ y $\mathbf{Q}_{t}$ son sólo escalares $\sigma_{\epsilon}$ y $\sigma_{\eta}$ respectivamente. Así que ahora quiero obtener los parámetros correctos para estos escalares utilizando la salida del filtro de Kalman y la función de loglikelihood
$$\log L(Y_{n}) = -\frac{np}{2}\log(2\pi) - \frac{1}{2}\sum^{n}_{t = 1}(log|\mathbf{F}_{t}| + v^{\mathsf{T}}_{t}\mathbf{F}_{t}^{-1}v_{t})$$
Donde $v_{t}$ es el error de estado y $\mathbf{F}_{t}$ es la varianza del error de estado. Ahora, aquí es donde estoy confundido. A partir del filtro de Kalman, tengo toda la información que necesito para calcular $L$ pero parece que esto no me acerca a poder calcular la máxima probabilidad de $\sigma_{\epsilon}$ y $\sigma_{\eta}$ . Mi pregunta es cómo puedo calcular la máxima probabilidad de $\sigma_{\epsilon}$ y $\sigma_{\eta}$ utilizando el enfoque de loglikelihood y la ecuación anterior? Un desglose algorítmico sería como una cerveza fría para mí ahora mismo...
Gracias por su tiempo.
Nota. Para el caso 1D $\mathbf{H}_{t} = \sigma^{2}_{\epsilon}$ y $\mathbf{H}_{t} = \sigma^{2}_{\eta}$ . Este es el modelo de nivel local univariante.