¿Qué pasos hay que seguir para utilizar los filtros de Kalman en los modelos de espacio de estados?
He visto un par de diferentes formulaciones, pero no estoy seguro de los detalles. Por ejemplo, Cowpertwait comienza con este conjunto de ecuaciones:
$$y_{t} = F^{'}_{t}\theta_{t}+v_{t}$$ $$\theta_{t} = G_{t}\theta_{t-1}+w_{t}$$
donde $\theta_{0} \sim N(m_{0}, C_{0}), v_{t} \sim N(0,V_{t})$ y $w_{t} \sim N(0, W_{t})$ , $\theta_{t}$ son nuestras estimaciones desconocidas y $y_{t}$ son los valores observados.
Cowpertwait define las distribuciones implicadas (a priori, probabilidad y distribución posterior, respectivamente):
$$\theta_{t}|D_{t-1} \sim N(a_{t}, R_{t})$$ $$y_{t}|\theta_{t} \sim N(F^{'}_{t}\theta_{t}, V_{t})$$ $$\theta_{t}|D_{t} \sim N(m_{t}, C_{t})$$
con
\begin {eqnarray} a_{t}&= G_{t}m_{t-1}, \qquad R_{t} &= G_{t}C_{t-1}G^{'}_{t} + W_{t} \\ e_{t}&=y_{t}-f_{t}, \qquad m_{t}&=a_{t}+A_{t}e_{t} \\ f_{t}&=F^{'}_{t}a_{t}, \qquad Q_{t}&=F^{'}_{t}R_{t}F_{t}+V_{t} \\ A_{t}&=R_{t}F_{t}Q^{-1}_{t}, \qquad C_{t}&=R_{t}-A_{t}Q_{t}A^{'}_{t} \end {eqnarray}
Por cierto, $\theta_{t}|D_{t-1}$ significa la distribución de $\theta_{t}$ dados los valores observados $y$ hasta $t-1$ . Una notación más sencilla es $\theta_{t|t-1}$ pero me quedaré con la notación de Cowpertwait.
El autor también describe la predicción de $y_{t+1}|D_{t}$ en términos de expectativas:
$$E[y_{t+1}|D_{t}] = E[F^{'}_{t+1}\theta_{t+1} + v_{t+1}|D_{t}] = F^{'}_{t+1}E[\theta_{t+1}|D_{t}] = F^{'}_{t+1}a_{t+1} = f_{t+1}$$
Por lo que entiendo, estos son los pasos, sin embargo, por favor, hágame saber si hay un error o una imprecisión:
- Comenzamos con $m_{0}$ , $C_{0}$ es decir, adivinamos un valor para nuestras estimaciones $\theta_{0}$ .
- Predecimos un valor para $y_{1}|D_{0}$ . Eso debería ser igual a $f_{1}$ que es $F^{'}_{1}a_{1}$ . $a_{1}$ se conoce desde $a_{1} = G_{1}m_{0}$ .
- Una vez que tengamos nuestra predicción para $y_{1}|D_{0}$ calculamos el error $e_{1} = y_{1} - f_{1}$ .
- El error $e_{1}$ se utiliza para calcular la distribución posterior $\theta_{1}|D_{1}$ que requiere $m_{1}$ y $C_{1}$ . $m1$ se da como una suma ponderada de la media a priori y el error: $a_{1} + A_{1}e_{1}$ .
- En la siguiente iteración, empezamos por predecir $y_{2}|D_{1}$ como en el paso 1. En este caso, $f_{2} = F^{'}_{2}a_{2}$ . Desde $a_{2} = G_{2}m_{1}$ y $m1$ es la expectativa de $\theta_{1}|D_{1}$ que ya hemos calculado en el paso anterior, entonces podemos proceder a calcular el error $e_{2}$ y la media de la distribución posterior $\theta_{2}|D_{2}$ como antes.
Creo que el cálculo de la distribución posterior $\theta_{t}|D_{t}$ es lo que algunos llaman el paso de actualización y el uso de la expectativa de $y_{t+1}|D_{t}$ es el paso de la predicción.
En aras de la brevedad, he omitido los pasos para calcular las matrices de covarianza.
¿Me he perdido algo? ¿Conoces una forma mejor de explicar esto? Creo que esto sigue siendo algo confuso, así que tal vez haya un enfoque más claro.