9 votos

Una función continua de una secuencia de vectores aleatorios converge en probabilidad a la función del límite

Proposición: Si $\{ X_n \}$ es una secuencia de vectores aleatorios k-dimensionales s.t. $X_n \overset{p}{\to} X$ y si $g: R^k \rightarrow R^m$ es un mapeo continuo, entonces $g(X_n) \overset{p}{\to} g(X)$ .

Prueba: Sea $K$ sea un número real positivo. Entonces, dado cualquier $\epsilon > 0$ tenemos enter image description here

enter image description here

No entiendo por qué $g$ es uniformemente continua y ¿podría tener algunos pasos/explicaciones adicionales para la declaración de inclusión que se deriva de esto?

5 votos

$g$ es uniformemente continua en $\{x : |x| \le K\}$ porque este conjunto es compacto y la continuidad en un conjunto compacto implica continuidad uniforme.

1 votos

No veo dónde va esta prueba. Parece ser una prueba de "sándwich a cero", lo que significa que la última expresión del lado derecho en la última serie de desigualdades de la imagen, que es la suma de cuatro probabilidades, debe ir a cero. La primera y la cuarta componente sí van a cero por la suposición de convergencia en la probabilidad de $X_n$ ¿pero el segundo y el tercero? El límite real $X$ puede ser cualquier cosa. ¿Qué me falta?

1 votos

@AlecosPapadopoulos Voy a editar el resto de la prueba.

5voto

jldugger Puntos 7490

Todo esto se reduce al hecho axiomático y evidente de que cuando $\mathcal{A}$ et $\mathcal{B}$ son eventos, entonces $\mathbb{P}(\mathcal{A} \cup \mathcal{B}) \le \mathbb{P}(\mathcal{A}) + \mathbb{P}(\mathcal{B})$ . Todo lo demás es sólo manipulación con conjuntos (que pueden visualizarse con diagramas de Venn).


Aplicar esto requiere decodificar la notación, lo que a su vez significa recordar que la mayor parte de ella es una abreviatura de subconjuntos de algún espacio muestral $\Omega$ . De entrada, es conveniente ver el par ordenado $\mathrm{Z}_n = (\mathrm{X}_n, \mathrm{X})$ como solo variable aleatoria con valores en el espacio métrico $M = \mathbb{R}^k\times \mathbb{R}^k$ .

Voy a reducir la mayor parte de esta notación a declaraciones sobre las imágenes inversas de las funciones de $\Omega$ a $\mathbb{R}$ .

En primer lugar, defina

$$g^\prime:M \to \mathbb{R},\ g^\prime((\mathrm{X}, \mathrm{Y})) = g(\mathrm{X}) - g(\mathrm{Y}).$$

La composición funcional

$$g^\prime \circ \mathrm{Z}_n:\Omega \to \mathbb{R},\ (g^\prime \circ \mathrm{Z}_n)(\omega) = g^\prime\left(Z_n\left(\omega\right)\right)$$

es una función de valor real sobre $\Omega$ .

Dejemos que

$$\mathcal{A}_n = \{|g(\mathrm{X}_n) - g(\mathrm{X})| \gt \varepsilon\} = \{\omega\in\Omega\,:\, |g(\mathrm{X}_n(\omega)) - g(\mathrm{X}(\omega))| \gt \varepsilon\}.$$

Es la imagen inversa del complemento del intervalo real $B(\varepsilon) = [-\varepsilon, \varepsilon]$ :

$$\mathcal{A}_n = (g^\prime \circ \mathrm{Z}_n)^{-1}(\mathbb{R} \setminus B(\varepsilon)).$$

Es sólo un montón de puntos en $\Omega$ . (En palabras: $\mathcal{A}_n$ consiste en todos los resultados en los que los valores de $g$ en $\mathrm{X}$ et $\mathrm{X}_n$ difieren demasiado).

(Para simplificar la notación, escribiremos los complementos del conjunto en $\mathbb{R}$ con sobrebarras, como en

$$\bar B(\varepsilon) = \mathbb{R} \setminus B(\varepsilon)$$

por ejemplo).

Del mismo modo, dejemos que

$$\mathcal{B} = \{\mathrm{X} \le K\} = \{\omega\in\Omega\,:\, \mathrm{X}(\omega) \le K\} = \mathrm{X}^{-1}(B(K))$$

(estos son los resultados en los que $\mathrm{X}$ está limitada por $K$ ) y

$$\mathcal{B}_n = \{\mathrm{X}_n \le K\} = \{\omega\in\Omega\,:\, \mathrm{X}_n(\omega) \le K\} = \mathrm{X}_n^{-1}(B(K))$$

(los resultados en los que $\mathrm{X}_n$ está limitada por $K$ ).

Por último, escribir

$$d:M\to\mathbb{R},\ d((\mathrm{X}, \mathrm{Y})) = |\mathrm{X}-\mathrm{Y}|,$$

set

$$\mathcal{C}_n = \{|\mathrm{X}_n-\mathrm{X}| \gt \gamma(\varepsilon)\} = \{\omega\in\Omega\,:\,|\mathrm{X}_n(\omega)-\mathrm{X}(\omega)| \gt \gamma(\varepsilon)\} = (d \circ \mathrm{Z}_n)^{-1}(\bar B(\gamma(\varepsilon)))$$

(los resultados en los que $\mathrm{X}_n$ difiere demasiado de $\mathrm{X}$ ).

Así, los cuatro conjuntos son imágenes inversas de funciones de valor real.

Ten en cuenta la relación entre las imágenes inversas de las funciones y los complementos. Cuando $f:A\to B$ es cualquier función entre conjuntos y $C\subset B$ entonces

$$ A \setminus f^{-1}(C) \subset f^{-1}(B\setminus C).$$

La prueba es sencilla: en el lado izquierdo están todos los elementos $x\in A$ que no se envían a $C$ por $f$ . Desde $f$ --al ser una función-- se define sobre todos los elementos de $A$ Cualquier cosa de este tipo $x$ debe enviarse al complemento de $C$ sur $B$ , QED.

Una vez eliminados estos preliminares mecánicos y teóricos del conjunto, podemos interpretar el texto. En la declaración después de "desde $g$ es uniformemente continua..." vemos

$$\{|g(\mathrm{X}_n - g(\mathrm{X})| \gt \varepsilon,\ \mathrm{X}\le K,\ \mathrm{X}_n \le K\} = \mathcal{A}_n \cap \mathcal{B} \cap \mathcal{B}_n$$

y en su lado derecho está $\mathcal{C}_n$ en sí mismo. En el primer paso que sigue a "Por lo tanto" vemos conjuntos como

$$``\mathrm{X} \gt K" = \mathrm{X}^{-1} (\bar B(K)) \supset \bar{\mathcal{B}}$$

et

$$``\mathrm{X}_n \gt K" = \mathrm{X}_n^{-1} (\bar B(K)) \supset \bar{\mathcal{B}_n}.$$

Sus probabilidades se suman. Esto sugiere que consideremos la relación entre

$$\mathcal{A}_n \cap \mathcal{B} \cap \mathcal{B}_n \subseteq \mathcal{C}_n$$

et

$$\mathcal{A}_n \subseteq \mathcal{C}_n \cup \bar{\mathcal{B}} \cup \bar{\mathcal{B}_n}.$$

La claridad de esta notación hace que ahora sea evidente que la primera inclusión implica la segunda, porque cualquier $\omega\in\mathcal{A}_n$ que no está en $\mathcal{B}\cap\mathcal{B}_n$ seguramente estará en

$$\Omega \setminus (\mathcal{B}\cap\mathcal{B}_n) = \bar{\mathcal{B}} \cup \bar{\mathcal{B}_n}.$$

Figure

La izquierda de la figura muestra un diagrama de Venn con $\mathcal{A}_n \cap \mathcal{B} \cap \mathcal{B}_n$ en gris, mientras que la derecha de la figura muestra $\mathcal{C}_n \cup \bar{\mathcal{B}} \cup \bar{\mathcal{B}_n} = \mathcal{C}_n \cup \left(\Omega \setminus \left(\mathcal{B} \cap \mathcal{B}_n\right)\right)$ en gris. La región gris izquierda está claramente contenida en la región gris derecha.

Cuando aplicamos las probabilidades, la primera desigualdad que sigue a "Por lo tanto" se deduce inmediatamente porque la probabilidad de una unión no puede superar la suma de las probabilidades, como se ha señalado al principio.

La siguiente desigualdad se deriva de la misma manera: Dejo el dibujo de su diagrama de Venn al lector interesado.

1 votos

¿Qué utilizaste para hacer esos magníficos dibujos del diagrama de Venn?

0 votos

@Matthew Mathematica. Es sólo una colección de RegionPlot objetos superpuestos a través de Show muy rápido y sucio. Los propios conjuntos están definidos por desigualdades cuadráticas, de modo que un par de cambios rápidos en las direcciones de dos de ellos convierte de forma fiable el gráfico de la izquierda en el de la derecha.

3voto

farzad Puntos 4180

Propuesta. Si $\{X_n\}_{n\geq 1}$ es una secuencia de $k$ -vectores aleatorios de dimensiones tales que $X_n\overset{\Pr}\to X$ y $g:\mathbb{R}^k\to\mathbb{R}^m$ es continua, entonces $g(X_n)\overset{\Pr}\to g(X)$ .

Prueba . Para cada $K>0$ , si $\|X_n(\omega)\|>K$ entonces $$\|X_n(\omega)-X(\omega)\|+\|X(\omega)\|\geq\|X_n(\omega)-X(\omega)+X(\omega)\|=\|X_n(\omega)\|>K,$$ lo que significa que, o bien $\|X_n(\omega)-X(\omega)\|>K/2$ o $\|X(\omega)\|>K/2$ . Por lo tanto, $$ \left\{\omega:\|X_n(\omega)\|>K \right\} \subset \left\{ \omega : \|X_n(\omega)-X(\omega)\|>K/2 \right\} \cup \left\{ \omega : \|X(\omega)\|>K/2 \right\}, $$ por cada $n\geq 1$ . Desde $g$ es una función continua, es uniformemente continua en el conjunto compacto $\{v\in\mathbb{R}^k:\|v\|\leq K\}$ . Por lo tanto, para cada $\epsilon>0$ existe un $\delta>0$ tal que, para $\|X_n(\omega)\|\leq K$ et $\|X(\omega)\|\leq K$ , si $\|X_n(\omega)-X(\omega)\|<\delta$ entonces $\|g(X_n(\omega))-g(X(\omega))\|<\epsilon$ . De ello se desprende, por contraposición, que $$\begin{align} &\left\{\omega: \|g(X_n(\omega))-g(X(\omega))\|\geq\epsilon, \|X_n(\omega)\|\leq K, \|X(\omega)\|\leq K \right\} \\ &\qquad\subset\left\{\omega: \|X_n(\omega)-X(\omega)\|\geq\delta, \|X_n(\omega)\|\leq K, \|X(\omega)\|\leq K \right\} \\ &\qquad\subset\left\{\omega: \|X_n(\omega)-X(\omega)\|\geq\delta\right\}. \end{align}$$ Además, la definición de $A_n=\{\omega:\|X_n(\omega)\|\leq K\}\cap\{\omega:\|X(\omega)\|\leq K\}$ y utilizando las inclusiones anteriores, tenemos $$ \begin{align} \Pr\!\left\{\omega: \|g(X_n(\omega))-g(X(\omega))\|\geq \epsilon\right\} &= \Pr\!\left(\left\{\omega: \|g(X_n(\omega))-g(X(\omega))\|\geq \epsilon\right\}\cap A_n\right) \\ &+ \Pr\!\left(\left\{\omega: \|g(X_n(\omega))-g(X(\omega))\|\geq \epsilon\right\}\cap A_n^c\right) \\ &\leq \Pr\!\left\{\omega: \|X_n(\omega)-X(\omega)\|\geq\delta \right\} + \Pr(A_n^c) \\ &\leq \Pr\!\left\{\omega: \|X_n(\omega)-X(\omega)\|\geq\delta \right\} \\ &+ \Pr\!\left\{\omega:\|X_n(\omega)\|>K \right\} + \Pr\!\left\{\omega:\|X(\omega)\|>K \right\} \\ &\leq \Pr\!\left\{\omega: \|X_n(\omega)-X(\omega)\|\geq\delta \right\} \\ &+ 2\Pr\!\left\{\omega:\|X(\omega)\|>K/2 \right\} \\ &+ \Pr\!\left\{\omega:\|X_n(\omega)-X(\omega)\|>K/2 \right\}, \end{align} $$ por cada $n\geq 1$ . Ya que, por hipótesis, $X_n\overset{\Pr}\to X$ se deduce que $$ \lim_{n\to\infty} \Pr\!\left\{\omega: \|g(X_n(\omega))-g(X(\omega))\|\geq \epsilon\right\} \leq 2\Pr\!\left\{\omega:\|X(\omega)\|>K/2 \right\}, \quad (*) $$ por cada $\epsilon>0$ , y cada $K>0$ (¡este es un punto lógico sutil y crucial!) . Porque el aumento de $K$ podemos hacer $2\Pr\!\left\{\omega:\|X(\omega)\|>K/2 \right\}$ arbitrariamente pequeño, la desigualdad $(*)$ es válida para cada $K>0$ si y sólo si $$ \lim_{n\to\infty} \Pr\!\left\{\omega: \|g(X_n(\omega))-g(X(\omega))\|\geq \epsilon\right\}=0, $$ por cada $\epsilon>0$ , dando como resultado que $g(X_n)\overset{\Pr}\to g(X)$ . $\quad\square$

Nota. Es mucho más fácil demostrar esta proposición utilizando el hecho de que $X_n\overset{\Pr}\to X$ si y sólo si para cualquier subsecuencia $\{n_i\}\subset\mathbb{N}$ hay una subsecuencia $\{n_{i_j}\}\subset\{n_i\}$ tal que $X_{n_{i_j}}\to X$ casi seguramente cuando $j\to\infty$ .

0 votos

Quiero aplicar este resultado para el caso $g()=\Phi()$ (la FCD de la distribución normal estándar). ¿Cree usted que $\Phi$ es una función continua?

0 votos

Sí, definitivamente.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X