Tratando de entender la matemática subyacente del algoritmo Metrópolis-Hasting, me encontré con esto papel en cadenas de Markov de estado continuo. En la página 3, el ejemplo 2 da una cadena de Markov que se afirma que es fuertemente $\phi$ -irreducible pero no $\phi$ -recurrente (en el ejemplo $\pi$ se utiliza en lugar de $\phi$ )
Por comodidad, transcribo las definiciones pertinentes y el ejemplo.
En la página 1 se dan las siguientes definiciones ( $P$ es un núcleo de probabilidad, y $(X, B)$ es un espacio medible):
$P$ es " $\phi$ -irreducible" si para todo $x \in X$ y todos $A \in B$ con $\phi(A) > 0$ hay un número entero positivo $n = n_{xA}$ tal que $P^n(x, A) > 0$
$P$ es "fuertemente $\phi$ -irreducible" si para todo $x \in X$ y todos $A \in B$ con $\phi(A) > 0$ hay un número entero positivo $n = n_{xA}$ tal que $P^m(x, A) > 0$ para todos $m \geq n$
$P$ es " $\phi$ -recurrente" si para todo $x \in X$ y todos $A \in B$ con $\phi(A) > 0$ una cadena de Markov que parte de $x$ en el momento $0$ golpea $A$ en algún momento positivo, a.s.; por supuesto, este momento es aleatorio
El ejemplo es el siguiente:
Dejemos que $X_1$ sea un conjunto finito, y $P$ una matriz estocástica en $X_1$ con todas las entradas estrictamente positivas. En estas circunstancias, existe una única probabilidad estacionaria $\pi$ y $P$ es $\pi$ -recurrente. Adjuntar una secuencia de estados 1, 2,..., cada uno con $\pi$ -probabilidad $0$ y las siguientes reglas de transición: $i \rightarrow i + 1$ con probabilidad $1/2^i$ con la probabilidad restante, $i$ va a un punto en $X_1$ elegido al azar entre $\pi$ . El núcleo resultante es fuertemente $\pi$ -irreducible, pero no $\pi$ -recurrente, debido a los estados colindantes.
No veo por qué el núcleo resultante no es $\pi$ -recurrente. En concreto, considero que la definición de $\phi-recurrent$ es equivalente a: $P(\tau_A = \infty \: | \: starting \: at \: x) = 0$ para todos $x \in X$ y todos $A \in B$ con $\phi(A) > 0$ , donde $\tau_A = min\{n > 0, X_n \in A\}$ (en este caso $P$ denota la probabilidad, no el núcleo)
Los estados que debemos examinar para esta propiedad son los estados contiguos. Por lo tanto, si en el momento $0$ la cadena comienza en $i$ que tenemos:
$$ P(\tau_A = \infty \: | \: starting \: at \: i) = P(i \rightarrow i + 1)P(\tau_A = \infty \: | \: starting \: at \: i+1) + (1-P(i \rightarrow i + 1))P(\tau_A = \infty \: | \: starting \: at \: x \in X_1) $$
Sin embargo, $P(\tau_A = \infty \: | \: starting \: at \: x \in X_1) = 0$ ya que el núcleo inicial es $\pi$ -recurrente, así:
$$ P(\tau_A = \infty \: | \: starting \: at \: i) = P(i \rightarrow i + 1)P(\tau_A = \infty \: | \: starting \: at \: i+1) $$
Inductivamente:
$$ P(\tau_A = \infty \: | \: starting \: at \: i) = \prod_{j=i}^\infty \frac{1}{2^j} = 0 $$
Entonces, ¿por qué el núcleo resultante no es $\pi$ -¿recurrente? ¿Hay algo que se me escapa?