10 votos

Explicación de los filtros de Kalman en los modelos de espacio de estados

¿Qué pasos hay que seguir para utilizar los filtros de Kalman en los modelos de espacio de estados?

He visto un par de diferentes formulaciones, pero no estoy seguro de los detalles. Por ejemplo, Cowpertwait comienza con este conjunto de ecuaciones:

$$y_{t} = F^{'}_{t}\theta_{t}+v_{t}$$ $$\theta_{t} = G_{t}\theta_{t-1}+w_{t}$$

donde $\theta_{0} \sim N(m_{0}, C_{0}), v_{t} \sim N(0,V_{t})$ y $w_{t} \sim N(0, W_{t})$ , $\theta_{t}$ son nuestras estimaciones desconocidas y $y_{t}$ son los valores observados.

Cowpertwait define las distribuciones implicadas (a priori, probabilidad y distribución posterior, respectivamente):

$$\theta_{t}|D_{t-1} \sim N(a_{t}, R_{t})$$ $$y_{t}|\theta_{t} \sim N(F^{'}_{t}\theta_{t}, V_{t})$$ $$\theta_{t}|D_{t} \sim N(m_{t}, C_{t})$$

con

\begin {eqnarray} a_{t}&= G_{t}m_{t-1}, \qquad R_{t} &= G_{t}C_{t-1}G^{'}_{t} + W_{t} \\ e_{t}&=y_{t}-f_{t}, \qquad m_{t}&=a_{t}+A_{t}e_{t} \\ f_{t}&=F^{'}_{t}a_{t}, \qquad Q_{t}&=F^{'}_{t}R_{t}F_{t}+V_{t} \\ A_{t}&=R_{t}F_{t}Q^{-1}_{t}, \qquad C_{t}&=R_{t}-A_{t}Q_{t}A^{'}_{t} \end {eqnarray}

Por cierto, $\theta_{t}|D_{t-1}$ significa la distribución de $\theta_{t}$ dados los valores observados $y$ hasta $t-1$ . Una notación más sencilla es $\theta_{t|t-1}$ pero me quedaré con la notación de Cowpertwait.

El autor también describe la predicción de $y_{t+1}|D_{t}$ en términos de expectativas:

$$E[y_{t+1}|D_{t}] = E[F^{'}_{t+1}\theta_{t+1} + v_{t+1}|D_{t}] = F^{'}_{t+1}E[\theta_{t+1}|D_{t}] = F^{'}_{t+1}a_{t+1} = f_{t+1}$$

Por lo que entiendo, estos son los pasos, sin embargo, por favor, hágame saber si hay un error o una imprecisión:

  1. Comenzamos con $m_{0}$ , $C_{0}$ es decir, adivinamos un valor para nuestras estimaciones $\theta_{0}$ .
  2. Predecimos un valor para $y_{1}|D_{0}$ . Eso debería ser igual a $f_{1}$ que es $F^{'}_{1}a_{1}$ . $a_{1}$ se conoce desde $a_{1} = G_{1}m_{0}$ .
  3. Una vez que tengamos nuestra predicción para $y_{1}|D_{0}$ calculamos el error $e_{1} = y_{1} - f_{1}$ .
  4. El error $e_{1}$ se utiliza para calcular la distribución posterior $\theta_{1}|D_{1}$ que requiere $m_{1}$ y $C_{1}$ . $m1$ se da como una suma ponderada de la media a priori y el error: $a_{1} + A_{1}e_{1}$ .
  5. En la siguiente iteración, empezamos por predecir $y_{2}|D_{1}$ como en el paso 1. En este caso, $f_{2} = F^{'}_{2}a_{2}$ . Desde $a_{2} = G_{2}m_{1}$ y $m1$ es la expectativa de $\theta_{1}|D_{1}$ que ya hemos calculado en el paso anterior, entonces podemos proceder a calcular el error $e_{2}$ y la media de la distribución posterior $\theta_{2}|D_{2}$ como antes.

Creo que el cálculo de la distribución posterior $\theta_{t}|D_{t}$ es lo que algunos llaman el paso de actualización y el uso de la expectativa de $y_{t+1}|D_{t}$ es el paso de la predicción.

En aras de la brevedad, he omitido los pasos para calcular las matrices de covarianza.

¿Me he perdido algo? ¿Conoces una forma mejor de explicar esto? Creo que esto sigue siendo algo confuso, así que tal vez haya un enfoque más claro.

3voto

Zolomon Puntos 250

Creo que lo que dices es correcto, y no creo que sea desordenado. Una forma de expresarlo sería decir que el filtro de Kalman es un algoritmo de corrección de errores, que modifica las predicciones en función de las discrepancias con las observaciones actuales. Esta corrección se realiza en su paso 4) utilizando la matriz de ganancia $A_t$ .

0 votos

Gracias por su respuesta. Tal vez sea correcta, pero me gustaría leer una explicación más detallada (y natural) de esto. He leído descripciones en libros y diapositivas, pero la mayoría no son muy claras y hay pequeñas diferencias.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X