El uso de la $\pi$-$\lambda$ teorema.
Para un conjunto $E \in \mathscr{F}$, definir $F_E : M \to [0,1]$$F_E(\mu) = \mu(E)$. Por supuesto, cada una de las $F_E$ es medible con respecto a $\mathscr{M}$.
Para un conjunto $A \in \mathscr{F} \otimes \mathscr{F}$, definir $G_A : M \to [0,1]$$G_A(\mu) = (\mu \times \mu)(A)$.
Deje $\mathcal{L}$ ser la colección de todos los $A \in \mathscr{F} \otimes \mathscr{F}$ tal que $G_A$ es medible.
Deje $\mathcal{P}$ ser la colección de todos los conjuntos de la forma $A = E_1 \times E_2$ donde $E_1, E_2 \in \mathcal{F}$. Tenga en cuenta que $\mathcal{P}$ es cerrado bajo intersecciones, es decir, un $\pi$-sistema.
Ahora observe:
Si $A = E_1 \times E_2 \in \mathcal{P}$ $G_A = F_{E_1} F_{E_2}$ que es una función medible. Por lo tanto $\mathcal{P} \subset \mathcal{L}$.
$G_X = 1$ que es una función medible, por lo $X \in \mathcal{L}$. (Nota: $M$ se compone sólo de la probabilidad de medidas)
Si $A \in \mathcal{L}$ $G_{A}$ es medible y, por tanto, también lo es $G_{A^c} = 1-G_{A}$. Por lo $A^c \in \mathcal{L}$.
Si $A_1, A_2, \dots \in \mathcal{L}$ son disjuntos, entonces dejando $A = \bigcup_n A_n$ tenemos $G_A = \sum_n G_{A_n}$ que es medible. Por lo $A \in \mathcal{L}$.
Así, hemos mostrado $\mathcal{L}$ $\lambda$- sistema. Por el $\pi$-$\lambda$ teorema, tenemos $\mathcal{L} \supset \sigma(\mathcal{P}) = \mathscr{F} \otimes \mathscr{F}$.
Es decir, todos los $G_A$ es una función medible, y tenemos $$\{\mu \in M: (\mu \times \mu)(A) \in B\} = G_A^{-1}(B) \in \mathscr{M}.$$