35 votos

Diferencia entre red Bayes, red neuronal, árbol de decisión y red Petri

¿Cuál es la diferencia entre red neuronal , Red bayesiana , árbol de decisiones y Redes de Petri Aunque todos son modelos gráficos y representan visualmente la relación causa-efecto.

3 votos

Tenga en cuenta que también hay Redes neuronales bayesianas (sólo para confundir), que son básicamente una red neuronal con un tratamiento bayesiano de los parámetros, por lo que puedo ver.

32voto

Nick Russo Puntos 51

¡Vaya, qué gran pregunta! La versión resumida de la respuesta es que el hecho de que se puedan representar dos modelos mediante representaciones visuales diagramáticamente similares no significa que estén ni remotamente relacionados desde el punto de vista estructural, funcional o filosófico. No conozco el FCM ni el NF, pero puedo hablar un poco de los otros.

Red bayesiana

En una red bayesiana, el gráfico representa las dependencias condicionales de las diferentes variables del modelo. Cada nodo representa una variable, y cada arista dirigida representa una relación condicional. Esencialmente, el modelo gráfico es una visualización de la regla de la cadena.

Red neuronal

En una red neuronal, cada nodo es una "neurona" simulada. La neurona está esencialmente encendida o apagada, y su activación está determinada por una combinación lineal de los valores de cada salida en la "capa" precedente de la red.

Árbol de decisiones

Digamos que utilizamos un árbol de decisión para la clasificación. El árbol nos proporciona esencialmente un diagrama de flujo que describe cómo debemos clasificar una observación. Empezamos en la raíz del árbol, y la hoja en la que terminamos determina la clasificación que predecimos.

Como puedes ver, estos tres modelos no tienen básicamente nada que ver entre sí, aparte de ser representables con cajas y flechas.

1 votos

Dejando de lado la teoría, ¿no es el árbol de decisión el que maneja las dependencias entre las variables al escupir los datos? Soy nuevo en el campo del aprendizaje automático y estoy más interesado en entender intuitivamente qué algo usar en qué escenario. A mí me parece que se utilizaría la red bayesiana cuando se conoce la relación exacta entre las variables, mientras que se utilizaría el árbol de decisión cuando se adivina que algunas variables pueden depender de otras, pero no se sabe exactamente cuáles. Me gustaría saber si esto parece correcto o si se puede explicar con más detalle la aplicabilidad de la red bayesiana y los árboles de decisión.

0 votos

Realmente creo que la respuesta debería apuntar tanto a las diferencias como a las similitudes para esbozar el panorama general, afirmar que "estos tres modelos no tienen básicamente nada que ver entre sí" es simplemente erróneo. El árbol de decisión y las redes neuronales adoptan el mismo enfoque discriminativo, en comparación con el enfoque generativo de BN. Mientras que los otros dos representan funciones, las redes bayesianas representan funciones generalizadas (distribuciones), ...

1 votos

La distinción entre descriminativo y generativo que se hace aquí es errónea. Las redes neuronales pueden utilizarse para construir modelos generativos. Por ejemplo, las GAN. Mi respuesta es suficiente porque la pregunta se reduce a "estos modelos se representan visualmente de forma similar, ¿significa eso que son estructuralmente similares?" y he explicado cómo estas representaciones gráficas están codificando información muy diferente.

7voto

Es fácil de demostrar (véase la obra de Daphne Koller curso ) que la Regresión Logística es una versión restringida de los Campos Aleatorios Condicionales, que son modelos gráficos no dirigidos, mientras que las Redes Bayesianas son modelos gráficos dirigidos. Entonces, la Regresión Logística también podría verse como un perceptrón de una sola capa. Este es el único vínculo (que es muy flojo) que creo que podría establecerse entre las redes bayesianas y las redes neuronales.

Todavía no he encontrado una relación entre los otros conceptos por los que has preguntado.

2 votos

Bienvenido al sitio, y gracias por esta contribución. ¿Puede explicar con más detalle cómo es fácil ver esto? Por el momento, se trata de una afirmación que puede no ser obvia para la gente. La información puede estar en el enlace, pero queremos que este hilo siga siendo informativo incluso después de que el enlace desaparezca.

0 votos

¡Hola y gracias! No estoy seguro de lo fina que debe ser la explicación (Daphne tarda al menos media hora en preparar la prueba) y tampoco la tengo especialmente fresca, pero la idea general es que el modelo logístico es una versión simplificada de la distribución de Gibbs, que a su vez es la base de los CRF.

1 votos

¿Qué significa crf? ¿Significa crf = campos aleatorios condicionales?

4voto

Edu Zamora Puntos 465

En primer lugar, intentamos establecer la naturaleza del problema que se intenta resolver con estos métodos. Si un problema es sencillo, polinómico o NP completo tenemos listos para enchufar algoritmos que podrían proporcionar una respuesta determinista, por simple recombinación de los axiomas a lo largo de reglas lógicas. Sin embargo, si ese no es el caso, tendríamos que confiar en un método de razonamiento, en el cual, intentamos tratar el problema como si fuera heterogéneo y conectarlo a una red, siendo los nodos evaluaciones y las aristas caminos entre los componentes.

En cualquier tipo de razonamiento basado en la red, no razonamos de forma deductiva, utilizando generalizaciones y combinaciones abstractas, según reglas lógicas en un flujo lineal, sino que trabajamos a través del problema basándonos en la propagación del razonamiento en diferentes direcciones, de forma que resolvemos el problema de un nodo a la vez, abierto a mejoras al descubrir nuevos hechos relativos a cualquier nodo en el futuro. Veamos ahora cómo cada una de estas técnicas aborda este método de resolución de problemas a su manera.

Red neuronal: La red neuronal es una caja negra, en la que se cree (nunca se ha podido comprobar desde fuera del sistema) que las conexiones entre los nodos simples se forman y acentúan mediante refuerzos externos repetidos. Aborda el problema de forma Connectionsitic paradigma. Es probable que el problema esté resuelto, pero hay poca explicabilidad. La red neuronal, ahora muy utilizada por su capacidad de producir resultados rápidos, si se pasa por alto el problema de la explicabilidad.

Red bayesiana: La red bayesiana es un gráfico acíclico dirigido, que se parece más al diagrama de flujo, sólo que el diagrama de flujo puede tener bucles cíclicos. La red bayesiana, a diferencia del diagrama de flujo, puede tener múltiples puntos de inicio. Básicamente traza la propagación de eventos a través de múltiples puntos ambiguos, donde el evento diverge probabilísticamente entre caminos. Obviamente, en cualquier punto de la red, la probabilidad de que ese nodo sea visitado depende de la probabilidad conjunta de los nodos precedentes. La red bayesiana se diferencia de la red neuronal en que se trata de un razonamiento explícito, aunque probabilístico y, por tanto, podría tener múltiples estados estables en función de que cada paso sea revisado y modificado dentro de los valores legales, al igual que un algoritmo. Es una forma robusta de razonar probabilísticamente, pero implica la codificación de las probabilidades, conjeturando los puntos en los que pueden ocurrir las acciones aleatorias y, por lo tanto, necesita un mayor esfuerzo heurístico para su construcción.

Árboles de decisión: El árbol de decisión es de nuevo una red, que se parece más a un diagrama de flujo, que está más cerca de la red bayesiana que de la red neuronal. Cada nodo tiene más inteligencia que la red neuronal y la ramificación puede decidirse mediante evaluaciones matemáticas o probabilísticas. Las decisiones son evaluaciones directas basadas en distribuciones de frecuencia de eventos probables, donde la decisión es probabilística. Sin embargo, en las redes bayesianas, la decisión se basa en la distribución de "pruebas" que apuntan a que un suceso ha ocurrido, en lugar de la observación directa del propio suceso.

Un ejemplo Por ejemplo, si tuviéramos que predecir el movimiento de un tigre devorador de hombres a través de algunas aldeas del Himalaya que casualmente se encuentran en el límite de alguna reserva de tigres, podríamos modelarlo con cualquiera de los dos enfoques siguientes:

En un árbol de decisión, nos basaríamos en las estimaciones de los expertos para saber si un tigre, dada la posibilidad de elegir entre campos abiertos o ríos, se decantaría por estos últimos. En una red bayesiana, rastreamos al tigre por las marcas de carabina, pero razonamos de manera que se reconozca que estas marcas de carabina podrían haber sido las de algún otro tigre de tamaño similar que patrullara rutinariamente su territorio. Si utilizamos una red neuronal, tendríamos que entrenar el modelo repetidamente utilizando diversas peculiaridades de comportamiento del tigre en general, como su preferencia por nadar, su preferencia por las zonas cubiertas frente a las abiertas, su evitación de las viviendas humanas, para que la red pueda razonar de forma general sobre el rumbo que podría seguir el tigre.

2voto

Earnest_learner Puntos 96

Excelente respuesta de @David Marx. Me he preguntado cuál es la diferencia entre el árbol de clasificación/regresión y la red bayesiana. Uno se basa en la entropía para clasificar un resultado en clases basadas en diferentes predictores y el otro construye una red gráfica utilizando independencia condicional y estimaciones de parámetros probabilísticos.

Creo que la metodología de construcción de la red bayesiana es diferente en comparación con el árbol de regresión/decisión. El algoritmo para el aprendizaje estructural, los objetivos para el uso de los modelos así como la capacidad inferencial de los modelos son diferentes.

El enfoque basado en la puntuación y el basado en las restricciones puede entenderse con algunos paralelismos trazados con los criterios de ganancia de información en las familias de árboles de decisión.

0voto

Abdul Rahman Puntos 40

En cuanto a los modelos gráficos, la Red de Petri formaliza el comportamiento de un sistema; en eso se diferencia claramente del resto de los modelos mencionados, todos los cuales se refieren a cómo se forma un juicio.

Merece la pena señalar que la mayoría de los nombres citados designan conceptos de IA bastante amplios, que a menudo se fusionan: por ejemplo, se puede utilizar una red neuronal para construir un árbol de decisión, mientras que la propia red neuronal, como se comentó en un post anterior, puede depender de la inferencia bayesiana.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X