Tengo una pregunta (quizás sencilla) sobre la regla de la cadena para la información mutua. La fórmula viene dada por
I(X1,X2,...,Xn;Y)=n∑i=1I(Xi;Y|Xi−1,Xi−2,...,X1)
Mi pregunta es cómo utilizarlo en la siguiente ecuación:
I(X;Y1,Y2)=I(X;Y1)+I(X;Y2|Y1)(1)
Sólo tengo I(X;Y1,Y2)=I(Y1,Y2;X)=I(X;Y1)+I(Y2;X|Y1)
Con la definición de información condicional y la regla de la cadena para la entropía se deduce que
I(X,Y2|Y1)=H(X|Y1)−H(Y2,X|Y1)+H(Y2|Y1)
y
I(Y2;X|Y1)=H(Y2|Y1)−H(X,Y2|Y1)+H(X|Y1)
Esto nos lleva a la ecuación H(Y2,X|Y1)=H(X,Y2|Y1) lo que evidentemente no es cierto. ¿Dónde me equivoco? Además, ¿cómo puedo derivar la ecuación (1) directamente por la regla de la cadena? También he seguido la prueba en wikipedia , lo cual entendí. Pero todavía no lo veo desde la regla de la cadena para la información mutua.
Muchas gracias por su ayuda y paciencia :)