Conozco las recursiones del filtro de Kalman y puedo derivarlas, pero lo que no entiendo realmente es cómo estimar los hiperparámetros utilizando la máxima verosimilitud.
Entiendo que al ejecutar el filtro de Kalman obtenemos el error de predicción y su varianza, que se puede utilizar para construir la función de verosimilitud.
Lo que no entiendo muy bien es el orden en que se hacen estos pasos. ¿Se supone que debo:
Método 1
1) Ejecutar el filtro de Kalman dados unos valores iniciales arbitrarios y obtener la función de verosimilitud.
2) Maximizar la función de verosimilitud con respecto a los hiperparámetros del modelo.
O
Método 2
1) Estimar los hiperparámetros del modelo de espacio de estados utilizando la máxima verosimilitud.
2) Ejecute el filtro Kalman con los hiperparámetros fijados en estas estimaciones.
He encontrado esta pregunta que responde a lo que necesito: Estimación de los parámetros de LogLikelihood para el filtro de Kalman lineal gaussiano . Aquí los hiperparámetros se estiman a partir de la función de verosimilitud y eso es lo mismo que el algoritmo de la p. 8 superior en estos notas de clase especifica. Sin embargo, en las mismas notas está escrito (p. 10 medio) "Dado un conjunto de valores óptimos de los parámetros, $\theta_{ML}$ Ahora vale la pena explorar las trayectorias de los componentes no observados...".
¿La forma correcta de realizar el análisis es la siguiente?
Método 3
1) Ejecutar el filtro de Kalman dados unos valores iniciales arbitrarios y obtener la función de verosimilitud.
2) Maximizar la función de verosimilitud con respecto a los hiperparámetros del modelo.
3) Ejecute de nuevo el filtro Kalman utilizando las estimaciones ML obtenidas en el paso 2) . ¿Utiliza estas estimaciones estatales en el siguiente análisis?