27 votos

Una visión teórica de la categoría del filtro de Kalman

Algunos antecedentes básicos

El filtro de Kalman es un algoritmo de estimación de estado (lineal) que supone que existe algún tipo de incertidumbre (óptimamente gaussiana) en las observaciones de estado del sistema dinámico. El filtro de Kalman se ha ampliado a sistemas no lineales, se ha restringido para casos en los que la observación directa del estado es imposible, etc. Como debe saberse, el algoritmo realiza esencialmente un paso de predicción basado en el conocimiento previo del estado, compara esa predicción con las mediciones y actualiza el conocimiento del estado basándose en una estimación de la covarianza del estado que también se actualiza en cada paso.

En resumen, tenemos un vector del espacio de estado representado normalmente por un vector en $\mathbb{R}^n$ . Este vector es operado por una matriz de planta, añadido a un término de control (que es operado por una matriz de control), operado por una matriz de covarianza, etc. Por lo general, no hay restricciones intrínsecas sobre el vector del espacio de estado más allá de las que puedan estar incluidas en la descripción del sistema dinámico.

Mi pregunta

¿Podemos describir el filtro de Kalman utilizando el lenguaje de la teoría de las categorías? En otras palabras, ¿podemos generalizar el álgebra de lo que ocurre con el filtro de Kalman para un sistema dinámico para desarrollar estimadores tipo Kalman para otros procesos con componentes vectoriales derivados de algún modelo conocido (o parcialmente conocido)?

Un ejemplo motivador

Un juego matricial repetido implica que dos o más jugadores eligen estrategias de acuerdo con alguna función de recompensa -que es una función del espacio de estados del juego y de la acción de cada jugador-, normalmente con alguna noción de equilibrio (por ejemplo, el equilibrio de Nash). Un juego repetido con un espacio de acción finito implica que las estrategias son distribuciones de probabilidad discretas representadas por un vector en $\mathbb{R}^N$ de manera que cada elemento del vector de estrategias sea no negativo y el vector sume la unidad.

Este es un caso más restrictivo que el de un sistema dinámico general porque tenemos restricciones en la representación vectorial de la estrategia. Pero, dada la entrada (es decir, las acciones realizadas), la salida (medición del estado del espacio de estados del juego) y una estructura de pagos, podría tener sentido intentar un estimador tipo Kalman para el vector de la estrategia en el juego.

El reto, por supuesto, es desarrollar una noción compatible de covarianza. No está claro qué significaría la covarianza en relación con las distribuciones de probabilidad, ya que no tratamos la cantidad $P(\textrm{action} = \textrm{index})$ como variable aleatoria. Pero si tuviéramos una visión teórica de la categoría del filtro de Kalman, ¿podríamos derivar una estructura similar basada en sus propiedades algebraicas de tal manera que podamos garantizar que nuestra estimación del vector de estrategia del oponente converge de alguna manera?

¿Tiene sentido lo que estoy preguntando?

12voto

Daniel Mahler Puntos 994

El enfoque más directo, ya mencionado por Chris Culter es utilizar el hecho de que los filtros de Kalman son un tipo de modelo gráfico y buscar tratamientos categóricos de los modelos gráficos. Se trata de un área bastante activa, especialmente entre las personas interesadas en la computación cuántica, la información cuántica y los fundamentos cuánticos en general. Los modelos gráficos suelen tratarse como cadena / tensor / rastrear diagramas, también conocidos como Notación de Penrose o lenguajes gráficos, más que directamente como categorías. La principal referencia sobre el tratamiento categórico abstracto de este tipo de diagramas es Peter Selinger, Un estudio de los lenguajes gráficos para las categorías monoidales También hay una bonita interdisciplinariedad encuesta de John Baez, que trata este tema y otros relacionados. Entre las personas con publicaciones en este sentido se encuentran Samson Abramsky, Bob Coecke, Jared Culbertson, Kirk Strutz, Robert Spekkens, John Baez, Jacob Biamonte, Mike Stay, Bart Jacobs, David Spivak y Brendan Fong, cuya tesis ya fue proporcionada por Chris Culter en su respuesta.

Los modelos gráficos de tratamientos categóricos requieren tratar con la probabilidad, lo que suele hacerse con mónadas, a menudo utilizando La mónada de Giry .

También es posible que desee consultar el trabajo del grupo de la ETH de Zúrich que incluye a Patrick Vontobel y Hans-Andrea Loeliger. Trabajan en un tipo de modelo gráfico que llaman gráficos de factores de Forney. No utilizan la teoría de las categorías, pero tienen documentos sobre cómo traducir muchos tipos de cálculos, incluidos los filtros de Kalman, los circuitos eléctricos y los algoritmos EM, a y desde sus modelos gráficos. Esto también proporciona un medio para traducir entre los filtros de Kalman y los circuitos eléctricos indirectamente, por lo que su trabajo podría ser útil para transformar los KF en otras cosas que ya tienen representaciones categóricas.

Aquí están los enlaces a algunos de los documentos:

8voto

user87023 Puntos 1

Un filtro de Kalman realiza la inferencia sobre un modelo que es una red bayesiana simple, y una red bayesiana es un tipo de modelo gráfico, y los modelos gráficos se parecen a las categorías, así que puede haber una conexión. Por desgracia, no puedo ir personalmente más allá de esa vaga descripción. Buscando en la web "modelo gráfico" + "teoría de categorías" apareció una tesis interesante: Brendan Fong (2012) "Causal Theories: A Categorical Perspective on Bayesian Networks". No hay ningún intento de conexión con la teoría de los juegos, ¡pero puede valer la pena echarle un vistazo!

5voto

nonlinearism Puntos 1319

Aquí hay algo en estas líneas (teoría de juegos de campo medio y filtrado de tipo Kalman): http://arxiv.org/abs/1302.6563

4voto

John Puntos 1592

En el documento Aprendizaje automático bayesiano mediante la teoría de las categorías En la sección 9.2, se aborda esta idea de un punto de vista categórico del filtrado de Kalman. Se trata de un HMM expresado en la categoría de probabilidades condicionales (categoría Kleisi de la mónada de Giry). Este modelo es omnipresente.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X