5 votos

Nivel principiante: Ayuda para aprender el Suavizador de Kalman (Parte 1)

Estimación de los parámetros de un sistema dinámico lineal es un tutorial que explica el Filtro Kalman, el Suavizado y la Maximización de la Expectativa. He seguido la derivación del filtro de Kalman. Pero no puedo entender el suavizado. He leído libros de texto y muchos otros recursos, incluyendo las referencias citadas en este documento, pero no pude entender cómo se derivan las ecuaciones de suavizado. Particularmente en este documento de caso, la Sección 6 menciona el Suavizador. En el paso E, se calcula el suavizador y el resultado del suavizado se incluye en las estimaciones obtenidas en el paso de maximización. Para el modelo

$h(t) = \mathbf{A^T} h(t-1) + \eta^h(t)$

$v(t) = \mathbf{B^T}h(t) + \eta^v(t)$

$\eta^h(t) = N(0,Q), \eta^v(t) =N(0,R)$

La probabilidad logarítmica es $Q= - \sum_{t=1}^{} \big(\frac{1}{2}[v(t) - Bh(t))'R^{-1}[v(t)-Bh(t)] \big) - \frac{T}{2} \log |R| - \sum_{t=2}^T \big( \frac{1}{2} [h(t)' - Ah(t-1)]'Q^{-1}[h(t) - Ah(t-1)]\big) - \frac{T-2}{2} \log |Q| -\frac{1}{2} {[h_1 - \pi_1]}' V_1^{-1}[h_1 - \pi_1] - \frac{1}{2} \log |V_1| - \frac{T(p+2) \log 2 \pi}{2}$

donde $\pi_1, V$ es la media y la varianza de la condición inicial de $h$ .

Sección 6: No puedo entender cómo se han obtenido las expresiones 2--6 de la página 7 y cuál es la técnica para incluirlas en el paso M. Sería muy útil que se ilustrara la derivación de cualquiera de las expresiones y la introducción de la estimación suavizada en el paso M.

0 votos

El enlace al tutorial no funciona (posiblemente era el mismo que "El filtro Kalman explicado" aquí: tristanfletcher.co.uk/tutoriales ). El tema se refiere al suavizador de Kalman mientras que la pregunta parece referirse a EM

5voto

Joeri Sebrechts Puntos 7483

Permítanme dar unos pasos atrás. El algoritmo EM no es necesario en un filtro Kalman si las matrices de diseño (A, B, Q, R, etc) son conocidas. Sólo se conocen si se sabe qué sistema físico se está modelando desde el principio. Si no es así, habrá que estimar estas matrices. Las operaciones de filtrado y suavizado se realizan asumiendo que estas matrices ya son conocidas.

EM utiliza las ecuaciones de filtrado o de suavizado comenzando con algunos valores iniciales aleatorios de las matrices de diseño y luego ejecutando las ecuaciones de filtrado (paso de expectativa) y luego reduciendo el error de predicción (paso de maximización). Es posible sustituir las ecuaciones de filtrado por las de suavizado en el procedimiento anterior. Se puede elegir entre el filtrado o el suavizado (para ser muy precisos, el filtrado es el primer paso del suavizado. Por lo tanto, el suavizado es como un complemento). La diferencia es que el filtrado sólo utiliza los valores pasados, mientras que el suavizado también tiene en cuenta los valores futuros.

Derivación EM para el filtro Kalman es probablemente la derivación más completa del procedimiento EM para el filtro/suavizador de Kalman.

En resumen, cuando se conocen las matrices de diseño, se ejecutan las ecuaciones de filtrado o de suavizado para ejecutar el filtro. Si no se conocen las matrices, se ejecuta el filtro mediante ecuaciones de filtrado o de suavizado y, a continuación, se modifican las matrices para mejorar los resultados de la operación anterior. Se repite este procedimiento hasta que las matrices no cambien mucho. Y a esto se le llama procedimiento EM. Lo bueno es que Kalman EM tiene soluciones claras para las derivadas en el procedimiento de maximización, por lo que no se necesitan técnicas numéricas para la maximización.

0 votos

Gracias por proporcionar este enlace y el razonamiento para aplicar Smoother. En mi caso, las matrices de diseño son desconocidas. He hojeado el enlace y aún así algunas partes no están claras. ¿Podría usted por favor compartir sus ideas? (1) Si los coeficientes/matrices y las covarianzas son desconocidos, ¿cómo podemos introducir la ecuación en el filtro de Kalman o en cualquier otro filtro? Es decir, ¿cómo conocemos la estructura física si estos parámetros son desconocidos? ¿Cómo asumimos o sabemos si el modelo es autorregresivo? Podría ser de media móvil

0 votos

(2)Volviendo al alisado, los diferentes recursos tienen diferentes ecuaciones para el alisado. La razón depende del modelo, y la expresión de la probabilidad, por lo tanto, las ecuaciones EM también difieren. Estoy siguiendo el artículo original de Zoubin Ghahramani, Parameter estimation for Linear dynamical system, ya que mi modelo es exactamente el que se explica aquí. ¿Cómo vienen las ecuaciones para el suavizado? El suavizado se realiza cuando todas las observaciones están disponibles (por lo tanto, el método fuera de línea). ¿Puede explicar alguna de ellas? Gracias.

0 votos

"introducir la ecuación en el Kalman". Esta frase no tiene sentido. Un filtro es un modelo específico. El Kalman es un modelo. Si tus datos no siguen el modelo del filtro, entonces el filtro no funcionará como se espera. Hay casos en los que se conoce la dinámica física del mundo real, por ejemplo la caída de una roca, tenemos ecuaciones de velocidad, aceleración. En estos casos se puede configurar el filtro Kalman y ajustar las matrices para que sigan estas ecuaciones. En otros casos, hay que empezar diciendo "no conozco las matrices pero estoy bastante seguro de que mis datos siguen la estructura de ecuaciones de Kalman".

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X