Algunos antecedentes básicos
El filtro de Kalman es un algoritmo de estimación de estado (lineal) que supone que existe algún tipo de incertidumbre (óptimamente gaussiana) en las observaciones de estado del sistema dinámico. El filtro de Kalman se ha ampliado a sistemas no lineales, se ha restringido para casos en los que la observación directa del estado es imposible, etc. Como debe saberse, el algoritmo realiza esencialmente un paso de predicción basado en el conocimiento previo del estado, compara esa predicción con las mediciones y actualiza el conocimiento del estado basándose en una estimación de la covarianza del estado que también se actualiza en cada paso.
En resumen, tenemos un vector del espacio de estado representado normalmente por un vector en $\mathbb{R}^n$ . Este vector es operado por una matriz de planta, añadido a un término de control (que es operado por una matriz de control), operado por una matriz de covarianza, etc. Por lo general, no hay restricciones intrínsecas sobre el vector del espacio de estado más allá de las que puedan estar incluidas en la descripción del sistema dinámico.
Mi pregunta
¿Podemos describir el filtro de Kalman utilizando el lenguaje de la teoría de las categorías? En otras palabras, ¿podemos generalizar el álgebra de lo que ocurre con el filtro de Kalman para un sistema dinámico para desarrollar estimadores tipo Kalman para otros procesos con componentes vectoriales derivados de algún modelo conocido (o parcialmente conocido)?
Un ejemplo motivador
Un juego matricial repetido implica que dos o más jugadores eligen estrategias de acuerdo con alguna función de recompensa -que es una función del espacio de estados del juego y de la acción de cada jugador-, normalmente con alguna noción de equilibrio (por ejemplo, el equilibrio de Nash). Un juego repetido con un espacio de acción finito implica que las estrategias son distribuciones de probabilidad discretas representadas por un vector en $\mathbb{R}^N$ de manera que cada elemento del vector de estrategias sea no negativo y el vector sume la unidad.
Este es un caso más restrictivo que el de un sistema dinámico general porque tenemos restricciones en la representación vectorial de la estrategia. Pero, dada la entrada (es decir, las acciones realizadas), la salida (medición del estado del espacio de estados del juego) y una estructura de pagos, podría tener sentido intentar un estimador tipo Kalman para el vector de la estrategia en el juego.
El reto, por supuesto, es desarrollar una noción compatible de covarianza. No está claro qué significaría la covarianza en relación con las distribuciones de probabilidad, ya que no tratamos la cantidad $P(\textrm{action} = \textrm{index})$ como variable aleatoria. Pero si tuviéramos una visión teórica de la categoría del filtro de Kalman, ¿podríamos derivar una estructura similar basada en sus propiedades algebraicas de tal manera que podamos garantizar que nuestra estimación del vector de estrategia del oponente converge de alguna manera?
¿Tiene sentido lo que estoy preguntando?