8 votos

Ley de los grandes números con una dependencia: $\frac{1}{n}\sum_{i=1}^n g(X,Y_i)$

Deje $\{Y_i\}_{i=1}^{\infty}$ ser una secuencia de independientes e idénticamente distribuidas (i.yo.d.) variables aleatorias. Deje $X$ ser otra variable aleatoria (posiblemente dependiente de $\{Y_i\}_{i=1}^{\infty}$). Deje $g:\mathbb{R}^2\rightarrow\mathbb{R}$ ser una función medible. Suponga que $E[g(x,Y_1)]$ está bien definida y finita para todas las $x \in \mathbb{R}$.

Me gustaría saber cuando hay existe una función determinista $f$ tal que
$$ \lim_{n\rightarrow\infty} \frac{1}{n}\sum_{i=1}^n g(X, Y_i) = f(X) \quad \mbox{with prob 1} $$ Estoy particularmente interesado en la función de candidato $f(x) = E[g(x, Y_1)]$.

He sido capaz de demostrar el resultado para el caso de al $X$ es discreto (ver más abajo). Estoy interesado en los resultados y/o contra-ejemplos para los casos más generales.


Contexto: Esta pregunta es un refinamiento de la pregunta aquí: Fuerte de la ley de los grandes números para la función de vector aleatorio: ¿se puede aplicar para un componente sólo?

En ese enlace, yo era capaz de demostrar el resultado siempre es el de $f(x)=E[g(x,Y_1)]$ al $X$ toma valores en un número finito o countably conjunto infinito.

4voto

Michael Puntos 5270

Fran comentario de conjeturas es cierto para $g$ una función simple. Aquí es un contra-ejemplo. De hecho, puede fallar incluso si $g$ es binario de valores.


Deje $A$ ser un subconjunto de los enteros positivos tales que el siguiente límite no existe: $$ \lim_{n\rightarrow\infty} \frac{1}{n} \sum_{i=1}^n 1_{\{i \in A\}} $$ donde $1_{\{i \in A\}}$ es un indicador de la función que es $1$ si $i \in A$, y 0 de otra cosa.

Definir $\{Y_i\}_{i=1}^{\infty}$ i.yo.d. y uniformemente distribuidas en $[0,1)$. Expresa cada una de las $Y_i$ en su único binario de expansión (que no contiene una infinita cola de 1s): $$Y_i = \sum_{j=1}^{\infty} B_{ij}2^{-j} = 0.B_{i1} B_{i2} B_{i3}...$$ A continuación, $(B_{ij})_{i,j=1}^{\infty}$ son yo.yo.d. y la misma probabilidad de ser 0 o 1. Podemos organizar estas en una red 2-d:

El $(B_{ij})$ grid:

\begin{align} B_{11} \: B_{12} \: B_{13} \: B_{14} \quad \leftrightarrow & \quad V_1 \: V_3 \: V_6 \: \cdots \\ B_{21} \: B_{22} \: B_{23} \: B_{24} \quad \leftrightarrow & \quad V_2 \: V_5 \: \cdots \\ B_{31} \: B_{32} \: B_{33} \: B_{34} \quad \leftrightarrow& \quad V_4 \: \cdots \end{align} Ahora el uso de la "diagonal" método de la lista de ellos como $\{V_1, V_2, V_3, ...\}$ donde $$V_1=B_{11}, V_2=B_{21}, V_3=B_{12}, V_4 = B_{31}, V_5 = B_{22}, V_6 = B_{13}, ...$$ y así sucesivamente. Además, cualquier número real $x \in [0,1)$ puede ser escrito como un "1-d de expansión": $$x=0.x_1x_2x_3x_4...$$ y esto puede ser reorganizado como un "2-d de expansión":

El 2-d de expansión de $x$:

\begin{align} &x_1 \: x_3 \: x_6 \: \cdots \\\ &x_2 \: x_5 \: \cdots \\ &x_4 \: \cdots \end{align} Ahora definimos la variable aleatoria $X$ como sigue: $$ X = \sum_{k=1}^{\infty} V_k 2^{-k} = 0.V_1 V_2 V_3... = 0.B_{11}B_{21}B_{12}...$$ Desde $\{V_k\}_{k=1}^{\infty}$ es yo.yo.d. binario y la misma probabilidad de ser 0 o 1, $X$ es distribuido uniformemente sobre $[0,1)$. Sin embargo, dado $X$, podemos obtener información acerca de la totalidad de $\{Y_i\}$ de la secuencia. Esto se realiza mediante la formación de 2-d de expansión de $X$, como se muestra en la imagen de arriba de la red 2-d de $(B_{ij})$, y observando que cada una de las $Y_i$ valor está constituida por su binario de expansión como la fila $i$ a partir de esa cuadrícula. Desde $\{Y_i\}_{i=1}^{\infty}$ son yo.yo.d. uniforme en el $[0,1)$, con una probabilidad de 1 $Y_i$ valores son diferentes. Por lo que podemos definir una función de $g$ que, dado $X$$Y_i$, extrae el índice de $i$.

Definir específicamente el binario de la función con valores de $g:[0,1)^2 \rightarrow \{0,1\}$ como sigue:

  • Definir $g(x,y) = 0$ si el 1-d de expansión de $y$ no aparece en cualquier fila de la 2-d de expansión de $x$, o si aparece en varias filas de la 2-d de expansión de $x$.

  • Definir $g(x,y) = 1_{\{i \in A\}}$ si el 1-d de expansión de $y$ aparece en la fila $i$ de la 2-d de expansión de $x$, y si aparece en ninguna fila distinta de $i$.

Ahora para cualquier $x\in [0,1)$ tenemos $E[g(x,Y_1)]=0$, ya que con prob 1, la 1-d de expansión de $Y_1$ no aparece en cualquier fila de la 2-d de expansión de $x$. Por otro lado, por la construcción sabemos que el 1-d de expansión de $Y_i$ está en la fila $i$ de la 2-d de expansión de $X$. Desde todos los $Y_i$ de los valores son distintos, con probabilidad 1, con una probabilidad de 1 en todas las filas de la 2-d de expansión de $X$ son distintos, y así (con probabilidad 1):
$$g(X, Y_i) = 1_{\{i \in A\}} \quad \forall i \in \{1, 2, 3, ...\} $$ Por lo tanto, con probabilidad 1, para todos los enteros positivos $n$ tenemos:
$$ \frac{1}{n}\sum_{i=1}^n g(X,Y_i) = \frac{1}{n}\sum_{i=1}^n 1_{\{i \in A\}} $$ y, por nuestra suposición en el set $A$, este límite como $n\rightarrow\infty$ no existe!


(Editar) de la Mensurabilidad de $g$

Observe que el $g$ función es, en efecto medible: Fijar un entero positivo $m$ y corregir $b \in \{0,1\}$. Observar que el conjunto de todos los $x=0.x_1x_2x_3... \in [0,1)$ tal que $x_m=b$ es una unión finita de intervalos. Por ejemplo, el conjunto de todos los $x \in [0, 1)$ tal que $x_2=1$ es igual a $$ [1/4,1/2) \cup [3/4, 1) $$

Fix $j$ como un entero positivo, fijar un conjunto de índices de $m_1, m_2, ..., m_j$, y arreglar una cadena binaria de $(b_1,b_2,..., b_j)$. Entonces el conjunto de todas las $x=0.x_1x_2x_3... \in [0,1)$ tal que $x_{m_1}=b_1, x_{m_2}=b_2, ..., x_{m_j}=b_j$ es la intersección finita uniones de intervalos y así es de por sí una unión finita de intervalos. Por ejemplo, el conjunto de todos los $x \in [0,1)$ de manera tal que los tres primeros dígitos de la fila 1 en el 2-d de expansión de $x$ "011" es igual al conjunto de todos los $x=0.x_1x_2x_3... \in [0,1)$ tal que $x_1=0, x_3=1, x_6=1$ (ver la foto de las 2-d de expansión de $x$ arriba, donde está claro que $x_1, x_3, x_6$ son los 3 primeros bits de la primera fila), y esta es una unión finita de intervalos.

Por lo tanto, fijar $i,j$ enteros positivos. Hay $2^j$ cadenas binarias de longitud $j$, enumerarlos y el índice de ellos por $k \in \{1, 2, ..., 2^j\}$. Deje $B_{ijk}$ ser el conjunto de todos los $(x,y) \in [0,1)^2$ de manera tal que el 1-d de expansión de $y$ tiene el primer $j$ bits igual a la $k$th cadena binaria, y la fila $i$ de la 2-d de expansión de $x$ tiene el primer $j$ bits también igual a la $k$th cadena binaria. El conjunto $B_{ijk}$ es el Cartesion producto $C_{ijk}\times D_{ijk}$ donde $C_{ijk}$ es una unión finita de intervalos en la $x$-eje y $D_{ijk}$ es un intervalo de la $y$ eje. Por lo $B_{ijk}$ es una unión de rectángulos y por lo tanto medibles. Definir $$ B_{ij} = \cup_{k=1}^{2^j} B_{ijk}$$ y tenga en cuenta que $B_{ij}$ es cuantificable. Tomando uniones, intersecciones y complementos con los (medibles) $B_{ij}$ conjuntos podemos formar el conjunto $\{(x,y) \in [0,1)^2 : g(x,y)=1\}$, como se muestra en el comentario de abajo, y por lo $g$ es medible.

0voto

Michael Puntos 5270

Aquí es una condición suficiente que sigue desde el discreto caso.


Deje $\mathcal{X}\subseteq \mathbb{R}$ $\mathcal{Y}\subseteq \mathbb{R}$ ser conjuntos tales que a$X \in \mathcal{X}$$Y_1 \in \mathcal{Y}$. Recordemos que $\{Y_i\}_{i=1}^{\infty}$ es yo.yo.d. y $X$ es posiblemente dependiente de $\{Y_i\}_{i=1}^{\infty}$. Definir $f(x) = E[g(x,Y_1)]$ todos los $x \in \mathbb{R}$. Definir la Propiedad * de la siguiente manera:

Propiedad *:

$$ \lim_{n\rightarrow\infty} \frac{1}{n}\sum_{i=1}^n g(X,Y_i) = f(X) \quad \mbox{ with prob 1} $$

Reivindicación 1:

Propiedad * mantiene siempre $\mathcal{X}$ es finita o countably conjunto infinito.

Prueba: Véase la respuesta aquí: Fuerte de la ley de los grandes números para la función de vector aleatorio: ¿se puede aplicar para un componente sólo?

$\Box$

Reivindicación 2:

Propiedad * vale si $g$ satisface la siguiente "a trozos uniformes de la continuidad" de la propiedad: Para cada una de las $\epsilon>0$ hay una secuencia de intervalos disjuntos $\{I_i^{(\epsilon)}\}_{i=1}^{\infty}$, cada intervalo de $I_i^{(\epsilon)}$ que tienen un tamaño finito (algunos intervalos, posiblemente, de ser "degenerados" por que consta de un solo punto), de tal manera que $\mathcal{X} \subseteq \cup_{i=1}^{\infty} I_i^{(\epsilon)}$, y para todos los $i \in \{1, 2, 3, \ldots\}$ y todos los $a,b \in I_i^{(\epsilon)}$ tenemos: $$ |g(a, y) - g(b,y)|\leq \epsilon \quad \forall y \in \mathcal{Y} $$

Prueba: Fix $\epsilon>0$. A continuación, $X \in \cup_{i=1}^{\infty}I_i^{(\epsilon)}$ y hay un único índice $i(X)$ tal que $X \in I_{i(X)}^{(\epsilon)}$. Definir $X_{\epsilon}$ como el discreto de la variable aleatoria es igual a la del punto medio de la $I_{i(X)}^{(\epsilon)}$. Entonces para todas las realizaciones de $X, \{Y_i\}$ tenemos: $$ |g(X_{\epsilon}, Y_k) - g(X, Y_k)| \leq \epsilon \quad \forall k \in \{1, 2, 3, …\}$$ Desde $X_{\epsilon}$ es discreto, por la Reivindicación 1 sabemos $$ \lim_{n\rightarrow\infty} \frac{1}{n} \sum_{i=1}^ng(X_{\epsilon}, Y_i) = f(X_{\epsilon}) \quad \mbox{ with prob 1} $$ Para todos los $n$ hemos \begin{align} \left|\frac{1}{n}\sum_{i=1}^n g(X,Y_i)-f(X)\right|&\leq \underbrace{\left|\frac{1}{n}\sum_{i=1}^n[g(X,Y_i)-g(X_{\epsilon},Y_i)]\right|}_{\leq \epsilon} \\ &\quad +\left|\frac{1}{n}\sum_{i=1}^n g(X_{\epsilon},Y_i) - f(X_{\epsilon})\right|\\ &\quad + \underbrace{\left|f(X_{\epsilon})-f(X)\right|}_{\leq \epsilon} \end{align} Tener un límite da, con una probabilidad de 1: $$ \limsup_{n\rightarrow\infty} \left|\frac{1}{n}\sum_{i=1}^n g(X,Y_i)-f(X)\right| \leq 2\epsilon $$ El de arriba tiene para todos los $\epsilon>0$, y el resultado de la siguiente manera. $\Box$

Reivindicación 3:

La hipótesis de la Reivindicación 2 mantenga siempre $\mathcal{Y}$ es un subconjunto compacto de $\mathbb{R}$ $g:\mathbb{R}\times \mathcal{Y}\rightarrow \mathbb{R}$ es continua.

Prueba: Escribir $\mathbb{R} = \cup_{i=-\infty}^{\infty} [i, i+1]$. La función de $g$ restringido al dominio compacto $[i, i+1]\times \mathcal{Y}$ es continuo a través de este dominio compacto, y por lo tanto uniformemente continua sobre este dominio compacto. Por lo tanto, es uniformemente continua sobre cada intervalo de la unión de intervalos disjuntos $\cup_{i=-\infty}^{\infty} [i, i+1)$. $\Box$

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X