13 votos

Diferencia en las distribuciones de probabilidad de dos núcleos diferentes

Me pregunto si los núcleos de probabilidad de los procesos de Markov en el mismo espacio de estados son lo suficientemente cercanos, ¿se mantiene también para las probabilidades del evento que dependen sólo de la primera $n$ valores del proceso.

Más formalmente, dejemos que $(E,\mathscr E)$ sea un espacio medible y ponga $(E^n,\mathscr E^n)$ , donde $\mathscr E^n$ es el producto $\sigma$ -Álgebra. Decimos que $P$ es un núcleo estocástico en $E$ si $$ P:E\times\mathscr E\to [0,1] $$ es tal que $P(x,\cdot)$ es una medida de probabilidad sobre $(E,\mathscr E)$ para todos $x\in E$ y $x\mapsto P(\cdot,A)$ es una función medible para todo $A\in \mathscr E$ . En el espacio $b\mathscr E$ de funciones medibles acotadas de valor real con una supra-norma $\|f\| = \sup\limits_{x\in E}|f(x)|$ definimos el operador $$ Pf(x) = \int\limits_E f(y)P(x,dy). $$ Su norma inducida viene dada por $\|P\| = \sup\limits_{f\in b\mathscr E\setminus 0}\frac{\|Pf\|}{\|f\|}.$ Además, para cualquier núcleo estocástico $P$ podemos asignar la familia de medidas de probabilidad $(\mathsf P_x)_{x\in E}$ en $(E^n,\mathscr E^n)$ que se define de forma única por $$ \mathsf P_x(A_0\times A_1\times \dots\times A_n) = 1_{A_0}(x)\int\limits_{A_n}\dots \int\limits_{A_1}P(x,dx_1)\dots P(x_{n-1},dx_n). $$

Consideremos otro núcleo $\tilde P$ que también define el operador sobre $b\mathscr E$ y la familia de medidas de probabilidad $\tilde{\mathsf P}_x$ en $(E^n,\mathscr E^n)$ . Me pregunto cuál es el límite superior de $$ \sup\limits_{x\in E}\sup\limits_{F\in \mathscr E^n}|\tilde{\mathsf P}_x(F) - \mathsf P_x(F)|. $$

Por inducción es fácil demostrar que $$ \sup\limits_{x\in E}|\tilde{\mathsf P}_x(A_0\times A_1\times \dots\times A_n)-\mathsf P_x(A_0\times A_1\times \dots\times A_n)|\leq n\cdot\|\tilde P - P\| $$ pero no estoy seguro de que este resultado pueda extenderse a cualquier subconjunto de $\mathscr E^n$ .

12voto

Grant Puntos 116

Espero tener una solución para el problema, así que la publico aquí. Estaré encantado si comentas la solución si es correcta o tal vez proporcionar más corto y ordenado.

  1. En primer lugar, cambio un poco la notación y uso $\mathsf P_x^n$ en lugar de $\mathsf P_x$ en OP para denotar la medida de probabilidad en el espacio $(E^n,\mathcal E^n)$ , sólo para mencionar la dependencia de $n$ expolíticamente. Entonces para todos los rectángulos medibles $B = A_1\times A_2\times\dots\times A_n\in \mathcal E^{n-1}$ y el conjunto $A_0\in \mathcal E$ sostiene que $$ \mathsf P_x^n(A_0\times B) = 1_{A_0}(x)\int\limits_{A_1}\dots \int\limits_{A_n}P(x_{n-1},dx_n)\dots P(x,dx_1) = 1_{A_0}(x)\int\limits_E \mathsf P_{y}^{n-1}(B)P(x,dy). $$ Por la unicidad de la medida de probabilidad $\mathsf P_x^n$ el mismo resultado es válido para cualquier $B\in \mathcal E^{n-1}$ : $$ \mathsf P_x^n(A_0\times B) = 1_{A_0}(x)\int\limits_E \mathsf P_{y}^{n-1}(B)P(x,dy). \tag{1} $$

  2. Para cualquier conjunto $C\in \mathcal E^n = \mathcal E\times\mathcal E^{n-1}$ podemos demostrar que $$ \mathsf P_x^n(C) = \int\limits_E \mathsf P_y^{n-1}(C_x)P(x,dy) \tag{2} $$ donde $C_x = \{y\in E^{n-1}:(x,y)\in C\}\in\mathcal E^{n-1}$ . Para demostrarlo, primero verificamos $(2)$ para rectángulos medibles $C = A\times B$ utilizando $(1)$ Por lo tanto $C_x = B$ si $x\in A$ y $\emptyset$ de lo contrario. Por el consejo de @tb este resultado se extiende además a todos los $C\in \mathcal E^n$ por $\pi$ - $\lambda$ teorema.

  3. La desigualdad $\left|\tilde{\mathsf P}_x^n(C) - \mathsf P_x^n(C)\right|\leq n\|\tilde P-P\|$ puede demostrarse entonces por inducción: se cumple claramente para $n=1$ $$ \left|\tilde{\mathsf P}^1_x(C) - \mathsf P^1_x(C)\right| = \left|\tilde P(x,C_x) - P(x,C_x)\right|\leq 1\cdot\|\tilde P - P\|. $$ Si la misma desigualdad es válida para $n-1$ tenemos $$ \begin{align} \left|\tilde{\mathsf P}_x^n(C) - \mathsf P_x^n(C)\right| &= \left|\int\limits_E \tilde{\mathsf P}_y^{n-1}(C_x)\tilde P(x,dy)-\int\limits_E \mathsf P_y^{n-1}(C_x)P(x,dy)\right| \\ &\leq \left|\int\limits_E \left(\tilde{\mathsf P}_y^{n-1}(C_x) - \mathsf P_y^{n-1}(C_x)\right)\tilde P(x,dy)\right|+\left|\langle \tilde P(x,\cdot) - P(x,\cdot),\mathsf P_{(\cdot)}^{n-1}(C_x)\rangle\right| \\ &\leq (n-1)\|\tilde P - P\|+\|\tilde P - P\| = n\|\tilde P - P\| \end{align} $$ donde $\langle m(\cdot),f(\cdot)\rangle = \int\limits_E f(y)\mu(dy)$ para todas las medidas acotadas $f$ y todas las medidas con signo finito $\mu$ . Dado que la RHS en el límite derivado no depende de $x,C$ significa que hemos demostrado los límites deseados.

3voto

bizzurnzz Puntos 31

La notación puede ser un poco engorrosa debido a las integrales anidadas, pero esta solución sólo se basa en propiedades muy básicas de la integración y es directa (sin inducción).

Considere la diferencia $a(x_0,F)=\mathsf P'_{x_0}(F)-\mathsf P_{x_0}(F)$ . Por la unicidad de la medida se deduce de la definición de $\mathsf P_{x_0}$ eso: $$\begin{align} a(x_0,F) =&\int_E\dots\int_E 1_F(x_1,\dots x_n) P'(x_{n-1},dx_n)\dots P'(x_0,dx_1)\\ &- \int_E\dots\int_E 1_F(x_1,\dots x_n) P(x_{n-1},dx_n)\dots P(x_0,dx_1) \end{align}$$

Introduciendo términos telescópicos intermedios podemos dividirlo en una suma de $n$ términos $a(x_0,F)=\sum_{j=1}^n a_j(x_0,F)$ donde $$\begin{align} a_j(x_0,F) =& \int_E\dots\int_E 1_F(x_1,\dots x_n) P'(x_{n-1},dx_n) \dots P'(x_{j-1},dx_j) P(x_{j-2},dx_{j-1})\dots P(x_0,dx_1)\\ &- \int_E\dots\int_E 1_F(x_1,\dots x_n) P'(x_{n-1},dx_n) \dots P'(x_j,dx_{j+1}) P(x_{j-1},dx_j)\dots P(x_0,dx_1) \end{align}$$

La parte más interna (formada por $n-j$ integrales anidadas) es común a ambos términos, para hacer las cosas más legibles lo factorizamos en $$g_j(x_1,\dots x_j) = \displaystyle\int_E\dots\int_E 1_F(x_1,\dots x_n) P'(x_{n-1},dx_n)\dots P'(x_j,dx_{j+1})$$ Entonces, por linealidad y $|\int f|\le\int |f|$ : $$\begin{align} |a_j(x_0,F)|\le& \int_E\dots\int_E\left|\int_E g_j(x_1,\dots x_j) \left(P'(x_{j-1},dx_j)-P(x_{j-1},dx_j)\right)\right| P(x_{j-2},dx_{j-1})\dots\\ \le& \int_E\dots\int_E\|P'-P\| P(x_{j-2},dx_{j-1})\dots P(x_0,dx_1)\\ =& \|P'-P\|\\ |a(x_0,F)|\le& n\cdot\|P'-P\| \end{align}$$ (el límite de la integral por $\|P'-P\|$ proviene de considerar la función $g_j(x_1,\dots x_{j-1},\cdot)$ )

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X