1 votos

Malentendido de la red bayesiana

Estoy aprendiendo sobre redes bayesianas (y PGMs en general) y estoy metido en esto. Básicamente estoy tratando de encontrar un error en mi razonamiento.

Considere este ejemplo (copiado de https://youtu.be/Nis3O4CVJAU?t=632 ):

enter image description here

Puedo obtener el resultado correcto dado utilizando el regla de la cadena si recorro los nodos de arriba a abajo (es decir, de $N$ a $1$ ):

\begin{align} p(x_1, \dots, x_N) &= \prod_{k=1}^N p(x_k | x_{k-1}, \dots, x_1) \\ &= p(x_N | x_{N-1} \dots, x_1) \cdots p(x_2 | x_1) p(x_1) \end{align}

En este caso $N=7$ y, por el gráfico: \begin{align} p(x_7 | x_6 \dots, x_1) &= p(x_7 | x_4, x_5) \\ p(x_6 | x_5 \dots, x_1) &= p(x_6 | x_4) \\ &\cdots \\ p(x_3 | x_2, x_1) &= p(x_3) \\ p(x_2 | x_1) &= p(x_2) \\ p(x_1) &= p(x_1) \\ \end{align}

El problema aparece cuando intento recorrer los nodos desde $1$ a $N$ :

\begin{align} p(x_1, \dots, x_N) &= p(x_1 | x_{2}, \dots, x_7) p(x_2 | x_{3}, \dots, x_7) \cdots p(x_7) \\ \end{align}

Para los nodos raíz, esto me parece razonable: \begin{align} p(x_1 | x_{2}, \dots, x_7) &= p(x_1)\\ p(x_2 | x_{3}, \dots, x_7) &= p(x_2)\\ p(x_3 | x_{4}, \dots, x_7) &= p(x_3)\\ \end{align}

Pero entonces sí:

\begin{align} p(x_4 | x_{5}, \dots, x_7) &= p(x_4) \\ p(x_5 | x_{6}, x_7) &= p(x_5) \\ p(x_6 | x_7) &= p(x_6) \\ p(x_7) &= p(x_7) \\ \end{align}

Lo cual, por un lado, tiene para estar equivocado, porque: $$ p(x_1, \dots, x_N) =^{??} p(x_1)\cdots p(x_7) $$

Y, por tanto, las variables serían independientes (!?).

Pero, por otro lado, tenemos que aplicar la propiedad definida en el gráfico (¿es esto correcto?): $$p(x_3 | x_1, x_2, x_4, x_5, x_6, x_7) = p(x_3)$$

Entonces, supongo que el error es que no se deduce de esa propiedad que $$p(x_3 | x_6, x_7) = p(x_3)$$

Pero si ese es el caso, ¿por qué es lo siguiente correcto? $$ p(x_3 | x_1, x_2, x_4, \dots, x_7) = p(x_3) \implies p(x_3 | x_1, x_2) = p(x_3) $$

Sospecho que puedo tener la definición de la propiedad mal, pero no estoy seguro.

2voto

redline Puntos 38

Sus supuestos de independencia no son en absoluto razonables.

No estoy seguro de lo que le dio la idea de que, por ejemplo,

$$p(x_1 | x_2,\ldots,x_7)=p(x_1).$$

No se puede suponer que ninguna variable de una red bayesiana sea independiente de sus vecinas inmediatas.

Anexo

La dirección de las flechas informa de la estructura de dependencia de las variables que no son vecinas inmediatas. Su desarrollo fue un intento de formalizar la intuición humana sobre la causalidad.

Debería haber alguna discusión en su texto sobre la separación d, las mantas de Markov, los colisionadores, etc. pero esencialmente para las uniones A, como se ve en la relación entre $x_1,x_4,x_5$ . Las variables $x_4$ y $x_5$ son independientes precisamente cuando se condiciona a $x_1$ mientras que para las uniones en V, como se ve en la relación entre $x_1,x_2,x_4$ las variables $x_1$ y $x_2$ son independientes precisamente cuando uno no lo hace condición en $x_4$ .

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X