Loading [MathJax]/jax/element/mml/optable/BasicLatin.js

9 votos

¿Una desigualdad de Hoeffding máxima?

Sea X1,,Xn sean variables aleatorias independientes de valor real que cumplan |Xk|1 y EXk=0 . Desigualdad de Hoeffding nos dice que para cualquier k=1,,n y t>0 , P(|X1++Xkk|t)2et2/2.

Mi pregunta es si existe un límite similar para el máximo sobre k . Más concretamente:

Pregunta: ¿Existen constantes absolutas C>0 y A>0 para que P(max es válido para t>0 ? Si no, ¿qué podemos decir de la izquierda?

0 votos

Si se cumple para cualquiera (es decir, todas) k ¿no cree que también es válido para el máximo sobre k ?

0 votos

Corregido.. Creo que la formulación original tiene sentido.

2voto

user87400 Puntos 120

Las desigualdades de Hoeffding para los valores absolutos se obtienen determinando primero el límite del valor y luego duplicándolo para llegar al límite del valor absoluto. Pero en este caso se pide un límite relacionado con el máximo del valor absoluto, no con el valor absoluto del máximo, por lo que es necesario un examen directo del valor absoluto.
Para compactar la notación, definimos S_k=\Big | X_1+\cdots+ X_k \Big | . Entonces estamos examinando

\mathbb P\Big( \max_{1\le k\le n} \Big | \frac{S_k}{\sqrt{k}} \Big | \ge t\Big) = \mathbb P\Big( \bigcup_k \Big\{ \Big|\frac{S_k}{\sqrt{k}} \Big | \ge t \Big\} \Big)

Denote I_Z la función indicadora del acontecimiento Z= \Big( \bigcup_k \Big\{ \Big|\frac{S_k}{\sqrt{k}} \Big |\ge t \Big\} \Big) y I_1,..., I_n las funciones indicadoras de los acontecimientos, \Big\{ \Big|\frac{S_1}{\sqrt{1}} \Big |\ge t \Big\},...\Big\{ \Big|\frac{S_n}{\sqrt{n}} \Big |\ge t \Big\} respectivamente. Entonces, por las propiedades de las funciones indicadoras I_Z=\max\Big \{I_1,...,I_n\Big \} Ahora bien I_Z =0 significa que todos I_i,\; i=1,...,n son cero. Si I_Z=1 significa que al menos una de estas funciones indicadoras individuales es la unidad, denótese I_m y tenemos I_m =1 \Rightarrow \Big|\frac{S_m}{\sqrt{m}} \Big |\ge t Sea v = \text{argmax}_k \Big | \frac{S_k}{\sqrt{k}} \Big | y \Big | \frac{S_v}{\sqrt{v}} \Big | la variable correspondiente. Entonces, en el caso en que I_Z =1 tenemos

\Big | \frac{S_v}{\sqrt{v}} \Big |\ge \Big|\frac{S_m}{\sqrt{m}} \Big |\ge t

Entonces, en todos los casos, ya sea cuando I_Z=0 o cuando I_Z=1 tenemos que, para algunos h>0 ,

I_Z \le \exp \left \{h\left (\Big | \frac{S_v}{\sqrt{v}} \Big |-t\right) \right \}

Por lo tanto,

\mathbb P\Big( \max_{1\le k\le n} \Big | \frac{S_k}{\sqrt{k}} \Big | \ge t\Big) = \mathbb P\Big( \bigcup_k \Big\{ \Big|\frac{S_k}{\sqrt{k}} \Big | \ge t \Big\} \Big) = EI_Z \le E\exp \left \{h\left (\Big | \frac{S_v}{\sqrt{v}} \Big |-t\right) \right \}

\Rightarrow \mathbb P\Big( \max_{1\le k\le n} \Big | \frac{S_k}{\sqrt{k}} \Big | \ge t\Big) \le e^{-ht} E\exp \left \{h \Big | \frac{S_v}{\sqrt{v}} \Big | \right \} \qquad [1]

Por el lema de Hoeffding, para una variable aleatoria Y con EY=0,\;a\le Y \le b tenemos, para cualquier \lambda E\left (e^{\lambda Y} \right) \le \exp \left(\frac{\lambda ^2 (b-a)^2}{8} \right) \qquad [2] En nuestro caso, tenemos \Big | \frac{S_v}{\sqrt{v}} \Big | = \frac{1}{\sqrt{v}}\Big |X_1 +...+ X_v\Big | \le \frac{1}{\sqrt{v}}\Big (\Big |X_1 \Big | +...+ \Big | X_v\Big | \Big) \le \frac{1}{\sqrt{v}}v = \sqrt{v}

la última desigualdad por los supuestos iniciales. Dado que v\le n tenemos 0\le \Big | \frac{S_v}{\sqrt{v}} \Big | \le \sqrt{n} \Rightarrow -E\Big(\Big | \frac{S_v}{\sqrt{v}} \Big |\Big) \le \Big | \frac{S_v}{\sqrt{v}} \Big | - E\Big(\Big | \frac{S_v}{\sqrt{v}} \Big |\Big) \le \sqrt{n} -E\Big(\Big | \frac{S_v}{\sqrt{v}} \Big |\Big) . Ahora tenemos una variable con valor esperado cero y acotada. La longitud del intervalo es b-a = \sqrt{n} -E\Big(\Big | \frac{S_v}{\sqrt{v}} \Big |\Big) + E\Big(\Big | \frac{S_v}{\sqrt{v}} \Big |\Big) = \sqrt{n} y \lambda = h . Insertando estos valores en el lema de Hoeffding y simplificando obtenemos

E\exp \Big \{h\Big | \frac{S_v}{\sqrt{v}} \Big | - hE\Big(\Big | \frac{S_v}{\sqrt{v}} \Big |\Big)\Big \} \le \exp \left(\frac{nh^2}{8} \right) \Rightarrow E\exp \Big \{h\Big | \frac{S_v}{\sqrt{v}} \Big | \Big \} \le \exp \left(\frac{nh^2}{8} \right)\exp\Big \{hE\Big(\Big | \frac{S_v}{\sqrt{v}} \Big |\Big)\Big \} \qquad [3] Nótese que la exponencial que se ha desplazado a la derecha no contiene ninguna cantidad aleatoria, por eso ha desaparecido el valor esperado. De antes tenemos \Big | \frac{S_v}{\sqrt{v}} \Big | \le \sqrt{n} \Rightarrow E\Big | \frac{S_v}{\sqrt{v}} \Big | \le \sqrt{n} \Rightarrow \exp\Big \{hE\Big(\Big | \frac{S_v}{\sqrt{v}} \Big |\Big)\Big \} \le \exp\Big \{h\sqrt{n}\Big \} \le \exp\Big \{h^2n\Big \} \; [4]

Insertar el lado derecho de [4] en [3] y de vuelta en [1] obtenemos

\mathbb P\Big( \max_{1\le k\le n} \Big | \frac{S_k}{\sqrt{k}} \Big |\Big )= \mathbb P\Big( \Big | \frac{S_v}{\sqrt{v}} \Big | \ge t\Big) \le \exp \left(-ht +\frac{9nh^2}{8} \right) \qquad [5] Minimización de la RHS sobre h obtenemos h^* = \frac {4}{9n}t e insertando en [5] obtenemos finalmente

\mathbb P\Big( \max_{1\le k\le n} \Big | \frac{S_k}{\sqrt{k}} \Big |\Big )=\mathbb P\Big( \Big | \frac{S_v}{\sqrt{v}} \Big | \ge t\Big) \le \exp\Big \{-\frac{2}{9n}t^2\Big \} \qquad [6]

...que es un límite relacionado con el número de v.r. involucrados.

1 votos

Tu identidad está equivocada. En su lugar deberías tener \mathbb P\Big( \max_{1\le k\le n} \Big | \frac{X_1+\cdots+ X_k}{\sqrt{k}} \Big | \ge t\Big) = \mathbb P\Big( \bigcup_k \Big\{ \Big|\frac{X_1+\cdots+ X_k}{\sqrt{k}} \Big | \ge t \Big\} \Big).

0 votos

Me corrijo. Estoy leyendo el artículo original de Hoeffding, donde creo que se puede encontrar, o deducir, la respuesta a su pregunta. Cambiaré mi respuesta en consecuencia.

1 votos

Estoy confundido. En [2], necesitas Y ser de media 0 ; además, v es una v.r. en lugar de una constante por tu suposición.

2voto

Davide Giraudo Puntos 95813

Tal como están las cosas, la desigualdad máxima no puede cumplirse ya que obtendríamos dejando que n yendo al infinito que \mathbb P\Big( \sup_{k\geqslant 1} \Big | \frac{X_1+\cdots+ X_k}{\sqrt{k}} \Big | \ge t \Big) \le C e^{-t^2/A}. Sin embargo, por la ley de los logaritmos iterados, la variable aleatoria \sup_{k\geqslant 1} \Big | \frac{X_1+\cdots+ X_k}{\sqrt{k}} \Big | es casi seguramente infinito, a menos que X_i=0 para cada i .

Sin embargo, es posible demostrar que \mathbb P\Big( \max_{1\le k\le n} \Big | \frac{X_1+\cdots+ X_k}{\sqrt{n}} \Big | \ge t \Big) \le C e^{-t^2/A}. Para verlo, veamos M_n:=\max_{1\leqslant k\leqslant n}\lvert X_1+\cdots+ X_k\rvert y S_n=\lvert X_1+\cdots+ X_n\rvert . Por la desigualdad de Doob, x\mathbb P\left(M_n>x\right)\leqslant \mathbb E\left[S_n\mathbf{1}_{\{M_n>x\}}\right]. Escribe la última expectativa como una integral de la cola sobre la recta real positiva y trunca esta integral en x/2 para conseguir que x\mathbb P\left(M_n>x\right)\leqslant 2\int_{x/2}^\infty \mathbb P\left(S_n>t\right)dt. Entonces usa la desigualdad de Hoeffding.

0voto

J. Doe Puntos 1

Fíjate en el Lemma 1 de este documento: https://arxiv.org/pdf/1312.7308.pdf

Dado que está tomando un máximo, el límite es en realidad un poco diferente, y el exponente no es con t^2 pero t^2/\log(t) . La idea de cómo demostrarlo es primero tomar un límite de unión ingenuo sobre una serie geométrica a k=1,2,4,8,16 (no necesariamente con 2 como base), entonces usa una desigualdad máxima que no involucre el denominador de \sqrt{k} (véase, por ejemplo, Thm 20.20 aquí: http://www.math.wisc.edu/~roch/grad-prob/gradprob-notes20.pdf ) para delimitar el resto k valores

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X