Esta es mi antigua pregunta
Me gustaría preguntar si alguien sabe la diferencia (si es que hay alguna) entre los modelos de Markov ocultos (HMM) y el filtro de partículas (PF), y como consecuencia el filtro de Kalman, o en qué circunstancias usamos cada algoritmo. Soy estudiante y tengo que hacer un proyecto, pero primero tengo que entender algunas cosas.
Así, según la bibliografía, ambos son Modelos de espacio de estado incluyendo los estados ocultos (o latentes o no observados). Según Wikipedia (Hidden_Markov_model) " En los HMM, el espacio de estados de las variables ocultas es discreto, mientras que las propias observaciones pueden ser discretas (normalmente generadas a partir de una distribución categórica) o continuas (normalmente a partir de una distribución gaussiana). Los modelos de Markov ocultos también pueden generalizarse para permitir espacios de estado continuos. Ejemplos de estos modelos son aquellos en los que el proceso de Markov sobre las variables ocultas es un sistema dinámico lineal, con una relación lineal entre las variables relacionadas y donde todas las variables ocultas y observadas siguen una distribución gaussiana. En casos sencillos, como el sistema dinámico lineal que acabamos de mencionar, la inferencia exacta es manejable (en este caso, utilizando el filtro de Kalman); sin embargo, en general, la inferencia exacta en los HMM con variables latentes continuas es inviable, y deben utilizarse métodos aproximados, como el filtro de Kalman ampliado o el filtro de partículas. "
Pero para mí esto es un poco confuso En palabras simples, ¿significa esto lo siguiente (basado también en más investigación que he hecho):
- En los HMM, el espacio de estados puede ser discreto o continuo . Además, las propias observaciones pueden ser discreto o continuo . Además, el HMM es un sistema dinámico lineal y gaussiano o no gaussiano.
- En la FP, el espacio de estado puede ser discreto o continuo . Además, las propias observaciones pueden ser discreto o continuo . Pero la FP es una no lineal (¿y no gaussiano?) sistema dinámico (¿es esa su diferencia?).
- El filtro Kalman (también me parece lo mismo que el HMM) se utiliza cuando tenemos lineal y Gaussiano sistema dinámico.
Además cómo sé qué algoritmo elegir, porque a mí todos me parecen iguales... También he encontrado un artículo (no en inglés) que dice que la FP, aunque puede tener datos lineales (por ejemplo los datos brutos de un sensor-kinect que reconoce un movimiento), el sistema dinámico puede ser no lineal. ¿Puede ocurrir esto? ¿Es esto correcto? ¿Cómo?
Para el reconocimiento de gestos, los investigadores pueden utilizar tanto HMM como PF, pero no explican por qué seleccionan cada algoritmo ¿Alguien sabe cómo me pueden ayudar a distinguir estos algoritmos, para entender sus diferencias y cómo elegir el mejor algoritmo?
Lo siento si mi pregunta es demasiado grande, o algunas partes son ingenuas, pero no encontré en algún lugar una respuesta convincente y científica. ¡Muchas gracias de antemano por su tiempo!
Aquí está mi NUEVA pregunta (según la ayuda de @conjugateprior)
Así que con la lectura posterior, me gustaría actualizar algunas partes de mi comentario anterior, y asegurarme de que he entendido un poco más lo que está pasando.
- De nuevo en palabras sencillas, el paraguas son las redes dinámicas bayesianas bajo las cuales los modelos de HMM y Espacio estatal se incluyen (subclases) ( http://mlg.eng.cam.ac.uk/zoubin/papers/ijprai.pdf ).
- Además, la diferencia inicial entre los 2 modelos es que, en el HMM las variables de estado ocultas son discreto mientras que las observaciones pueden ser discreto o continuo . En la FP las variables de estado ocultas son continuo (vector de estado oculto de valor real), y las observaciones tienen Distribuciones gaussianas .
- También según @conjugateprior cada modelo tiene las 3 siguientes tareas: filtrado, suavizado y predicción. En el filtrado, el modelo HMM utiliza para las variables de estado ocultas discretas el método Forward algorithm, el espacio de estado utiliza para las variables continuas y el sistema dinámico lineal el Kalman Filter, etc.
- Sin embargo, el HMM también puede generalizarse para permitir espacios de estado continuos .
- Con estas extensiones de HMM, los 2 modelos parecen ser conceptualmente idénticos (como también se menciona en ¿Modelo de Markov oculto vs. Modelo de Transición de Markov vs. Modelo de Espacio de Estado...? ).
Creo que estoy utilizando una terminología un poco más precisa, pero aún así todo me resulta borroso. ¿Puede alguien explicarme cuál es el diferencia entre el HMM y el modelo de espacio de estados ?
Porque realmente no puedo encontrar una respuesta que se ajuste a mis necesidades..
Gracias una vez más.