36 votos

¿Cuál es la relación entre los modelos jerárquicos, las redes neuronales, los modelos gráficos y las redes bayesianas?

Todos ellos parecen representar variables aleatorias mediante los nodos y la (in)dependencia a través de las aristas (posiblemente dirigidas). Me interesa especialmente el punto de vista de un bayesiano.

31voto

Dan Appleyard Puntos 223

Una red bayesiana es un tipo de modelo gráfico. El otro "gran" tipo de modelo gráfico es un campo aleatorio de Markov (MRF). Los modelos gráficos se utilizan para la inferencia, la estimación y, en general, para modelar el mundo.

El término modelo jerárquico se utiliza para significar muchas cosas en diferentes ámbitos.

Aunque las redes neuronales vienen con "gráficos", generalmente no codifican información de dependencia y los nodos no representan variables aleatorias. Las redes neuronales son diferentes porque son discriminativas. Las redes neuronales más populares se utilizan para la clasificación y la regresión.

Kevin Murphy tiene una excelente introducción a estos temas disponible aquí .

9voto

DavLink Puntos 101

Como @carlosdc Dicho esto, una red bayesiana es un tipo de modelo gráfico (es decir, un grafo acíclico dirigido (DAG) cuya estructura define un conjunto de propiedades de independencia condicional). Modelos jerárquicos de Bayes también pueden representarse como DAGs; Clasificadores jerárquicos Naive Bayes para datos inciertos de Bellazzi et al., ofrece una buena introducción a la clasificación con este tipo de modelos. Sobre los modelos jerárquicos, creo que se pueden recuperar muchos artículos buscando en Google con las palabras clave adecuadas; por ejemplo, yo encontré este:

C. H. Jackson, N. G. Best y S. Richardson. Modelos gráficos bayesianos para la regresión en conjuntos de datos múltiples con diferentes variables . Bioestadística (2008) 10(2): 335-351.

Michael I. Jordan tiene un buen tutorial sobre Modelos gráficos con diversas aplicaciones basadas en el factorial Modelo de Markov oculto en bioinformática o procesamiento del lenguaje natural. Su libro, Aprendizaje en modelos gráficos (MIT Press, 1998), también merece la pena leerlo (hay una aplicación de los MM a la modelización estructural con BUGS código, pp. 575-598)

0voto

JCrafter Puntos 21

Las redes neuronales no requieren priores, pero cada nodo oculto (neuronas) de una red neuronal puede ser considerado como CPD - CPD ruidoso OR/AND para un nodo lineal - CPD sigmoide para un nodo logístico

Así, las redes neuronales podrían verse como múltiples capas de nodos ocultos, cada una de ellas con CPDs lineales/sigmoidales

La clase de Koller en Coursera O su libro de texto deberían ser una buena referencia para los tipos de DPC.

0 votos

¿Qué significa CPD?

1 votos

@gwr CPD significa distribución de probabilidad condicional

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X