Diferencia intuitiva entre modelos ocultos de Markov y campos aleatorios condicionales

Question

Diferencia intuitiva entre modelos ocultos de Markov y campos aleatorios condicionales

Preguntado el 5 de Mayo, 2013: Cuando se hizo la pregunta
3936 visitas: Cuantas visitas ha tenido la pregunta
3 Respuestas: Cuantas respuestas ha tenido la pregunta
Abierta: Estado actual de la pregunta

Entiendo que los HMMs (Modelos de Markov Ocultos) son modelos generativos, y los CRF son modelos discriminativos. También entiendo cómo se diseñan y utilizan los CRFs (Campos Aleatorios Condicionales). Lo que no entiendo es cómo son diferentes de los HMMs. He leído que en el caso de los HMM, solo podemos modelar nuestro próximo estado en el nodo anterior, nodo actual y probabilidad de transición, pero en el caso de los CRFs podemos hacer esto y podemos conectar un número arbitrario de nodos juntos para formar dependencias o contextos. ¿Estoy en lo correcto aquí?

Preguntado el 5 de Mayo, 2013 por user1343318

4 votos

Los lectores de este comentario quizás no les guste esta respuesta, pero si realmente necesitan saber la respuesta, la mejor manera de entender es leer los documentos ustedes mismos y formar su propia opinión. Esto lleva mucho tiempo, pero es la única forma de saber realmente qué está sucediendo y poder decir si otras personas les dicen la verdad.

Comentado el 25 de Enero, 2019 por Annie

0 votos

¿A qué papel te refieres? Por favor comparte.

Comentado el 13 de Julio, 2022 por rusoaie

Answer 1

3 Respuestas

Answer 2

31voto

NotAnAndroidUser Puntos 11

Desde la introducción a los CRFs de McCallum:

ingresa descripción de la imagen aquí

Respondido el 30 de Abril, 2015 por NotAnAndroidUser (11 Puntos )

7 votos

¿Te importaría agregar tu propia intuición/percepción/comprensión a esto, incluso si solo señalas los aspectos más destacados (desde tu perspectiva)?

Comentado el 14 de Enero, 2018 por Luan Cristian Thums

Answer 3

19voto

Mike McCabe Puntos 524

Como nota al margen: Te pediría amablemente que mantengas esta lista (incompleta) para que los usuarios interesados tengan un recurso fácilmente accesible. El estado actual aún requiere que las personas investiguen muchos documentos y/o informes técnicos largos para encontrar respuestas relacionadas con CRFs y HMMs.

Además de las otras respuestas ya buenas, quiero señalar las características distintivas que considero más notables:

Los HMMs son modelos generativos que intentan modelar la distribución conjunta P(y,x). Por lo tanto, estos modelos intentan modelar la distribución de los datos P(x) que a su vez pueden imponer características altamente dependientes. Estas dependencias a veces son no deseadas (por ejemplo, en el etiquetado de POS de NLP) y muy a menudo difíciles de modelar/calcula.
Los CRFs son modelos discriminativos que modelan P(y|x). Como tal, no requieren modelar explícitamente P(x) y dependiendo de la tarea, pueden por lo tanto ofrecer un mejor rendimiento, en parte porque necesitan menos parámetros para ser aprendidos, por ejemplo, en configuraciones donde no se desea generar muestras. Los modelos discriminativos suelen ser más adecuados cuando se utilizan características complejas y superpuestas (ya que a menudo es difícil modelar su distribución).
Si tienes características superpuestas/ complejas (como en el etiquetado de POS) es posible que quieras considerar los CRFs ya que pueden modelarlas con sus funciones de características (ten en cuenta que normalmente tendrás que ingeniar estas funciones de características).
En general, los CRFs son más potentes que los HMMs debido a su aplicación de funciones de características. Por ejemplo, puedes modelar funciones como 1($y_t$=NN, $x_t$=Smith, $cap(x_{t-1})$=true) mientras que en los HMMs (de orden primero) se utiliza la suposición de Markov, imponiendo una dependencia solo al elemento anterior. Por lo tanto, considero a los CRFs como una generalización de los HMMs.
También nota la diferencia entre CRFs lineales y generales. Los CRFs lineales, al igual que los HMMs, solo imponen dependencias en el elemento anterior mientras que con los CRFs generales puedes imponer dependencias a elementos arbitrarios (por ejemplo, el primer elemento se accede al final de una secuencia).
En la práctica, verás los CRFs lineales con más frecuencia que los CRFs generales ya que suelen permitir una inferencia más sencilla. En general, la inferencia en CRF a menudo es intratable, dejándote con la única opción tratable de la inferencia aproximada).
La inferencia en CRFs lineales se realiza con el algoritmo de Viterbi al igual que en los HMMs.
Tanto los HMMs como los CRFs lineales suelen entrenarse con técnicas de Máxima Verosimilitud como el descenso de gradiente, métodos cuasi newtonianos o en el caso de los HMMs con técnicas de Maximización de Expectativas (algoritmo de Baum-Welch). Si los problemas de optimización son convexos, todos estos métodos ofrecen el conjunto de parámetros óptimo.
Según [1], el problema de optimización para aprender los parámetros del CRF lineal es convexo si todos los nodos tienen distribuciones de familia exponencial y se observan durante el entrenamiento.

[1] Sutton, Charles; McCallum, Andrew (2010), "Una Introducción a los Campos Aleatorios Condicionales"

Respondido el 22 de Abril, 2018 por Mike McCabe (524 Puntos )

Answer 4

13voto

Karl Damgaard Asmussen Puntos 445

"Los Campos Aleatorios Condicionales pueden ser entendidos como una extensión secuencial al Modelo de Entropía Máxima". Esta oración es de un informe técnico relacionado con "Modelos Probabilísticos Clásicos y Campos Aleatorios Condicionales".

Probablemente sea la mejor lectura para temas como HMM, CRF y Entropía Máxima.

PD: La Figura 1 en el enlace proporciona una muy buena comparación entre ellos.

Saludos,

Respondido el 6 de Mayo, 2013 por Karl Damgaard Asmussen (445 Puntos )

Diferencia intuitiva entre modelos ocultos de Markov y campos aleatorios condicionales

Respuestas

Preguntas Destacadas

Etiquetas mas usadas

i-Ciencias.com

Powered by:

Diferencia intuitiva entre modelos ocultos de Markov y campos aleatorios condicionales

Respuestas

Preguntas relacionadas

Preguntas Destacadas

Etiquetas mas usadas

En nuestra red

i-Ciencias.com

Powered by: