Si nos atenemos estrictamente a lo que dice la definición 2.25 del enlace, $P$ es una función $P : \mathcal{X} \to \mathcal{P}(\mathcal{X})$ , donde $\mathcal{P}(\mathcal{X})$ es el espacio de medidas de probabilidad sobre $(\mathcal{X}, \mathscr{B}(\mathcal{X}))$ (presumiblemente $\mathcal{X}$ es un espacio topológico y $\mathscr{B}(\mathcal{X})$ es el $\sigma$ -de subconjuntos de Borel de $\mathcal{X}$ Pero no he leído las notas para comprobar si eso es cierto). Eso significa que para cada $a \in \mathcal{X}$ , $P(a)$ es una medida de probabilidad sobre $(\mathcal{X}, \mathscr{B}(\mathcal{X}))$ por lo que para cada $A \in \mathscr{B}(\mathcal{X})$ , $(P(a))(A)$ es un número entre $0$ y $1$ .
Puedes pensar en $P$ como una "medida de probabilidad aleatoria" si se equipa $\mathcal{P}(\mathcal{X})$ con un $\sigma$ -álgebra que hace $P$ una función medible. Normalmente, esto se hace dotando $\mathcal{P}(\mathcal{X})$ con el $\sigma$ -Álgebra $\mathcal{H}$ que es el más pequeño $\sigma$ -tal que para cada $B \in \mathscr{B}(\mathcal{X})$ el mapa $Q \mapsto Q(B)$ de $\mathcal{P}(\mathcal{X})$ a $[0, 1]$ es medible (es decir, $\mathcal{H}$ es generado por todos esos mapas). De esta manera, $P : \mathcal{X} \to \mathcal{P}(\mathcal{X})$ es una función medible, por lo que es un "elemento aleatorio" de $\mathcal{P}(\mathcal{X})$ .
El enfoque de la medida de probabilidad aleatoria es una forma de definir la probabilidad de transición $P$ . Otro enfoque es el uso de los llamados núcleos de transición (también conocidos como núcleos de Markov, etc.).
Si $(\mathcal{X}, \mathcal{F})$ y $(\mathcal{Y}, \mathcal{G})$ son dos espacios de medida, entonces a núcleo de transición de $(\mathcal{X}, \mathcal{F})$ a $(\mathcal{Y}, \mathcal{G})$ es una función $Q : \mathcal{X} \times \mathcal{G} \to [0, 1]$ tal que
- para cada $x \in \mathcal{X}$ el mapa $Q(x, \cdot) : \mathcal{G} \to [0, 1]$ es una medida de probabilidad sobre $(\mathcal{Y}, \mathcal{G})$ y
- para cada $G \in \mathcal{G}$ el mapa $Q(\cdot, G) : \mathcal{X} \to [0, 1]$ es $\mathcal{F}$ -Medible.
Dado un núcleo de transición $Q$ de $(\mathcal{X}, \mathcal{F})$ a $(\mathcal{Y}, \mathcal{G})$ podemos definir una medida aleatoria $P : \mathcal{X} \to \mathcal{P}(\mathcal{Y})$ , donde $\mathcal{P}(\mathcal{Y})$ representa el espacio de medidas de probabilidad en $(\mathcal{Y}, \mathcal{G})$ definiendo $$ (P(a)(A)) = Q(a, A) $$ para cada $a \in \mathcal{X}$ y $A \in \mathcal{G}$ . A la inversa, dada una medida aleatoria $P : \mathcal{X} \to \mathcal{P}(\mathcal{Y})$ podemos definir un núcleo de transición $Q$ de $(\mathcal{X}, \mathcal{F})$ a $(\mathcal{Y}, \mathcal{G})$ por la misma relación. Por lo tanto, existe una correspondencia uno a uno entre las medidas de probabilidad aleatorias y los núcleos de transición.
Por ello, es habitual utilizar una notación como $P(a, A)$ cuando $P$ es una medida de probabilidad aleatoria que representa $(P(a))(A)$ la notación $P(a, A)$ es más fácil de leer, y realmente no estás haciendo nada malo al tratar la medida de probabilidad aleatoria como un núcleo de transición.