17 votos

¿Desigualdad de concentración para la suma de cuadrados de variables aleatorias subexponenciales i.i.d.?

Supongamos que $X_1, X_2, \ldots, X_n$ son independientes y cada una tiene la misma distribución con un sub-exponencial variable aleatoria $X$ (por ejemplo, $X$ es el cuadrado de una variable gaussiana normal estándar). ¿Puedo obtener una desigualdad de concentración para el cuadrado de la sub-exponencial $X_i$ digamos,

$$\mathbb{P}\left( \frac{1}{n} \left( X_1^2+\cdots+X_n^2 \right) \ge \mathbb{E}\left[X^2\right] + t \right) \le C \exp\left( - n \cdot \min\left( C_1 t^2, C_2 t, C_3 \sqrt{t} \right) \right),$$

donde $C, C_1, C_2, C_3$ ¿son constantes?

Este problema se plantea en mi investigación.


Observación:

En realidad, para el i.i.d. sub-Gaussiano variables aleatorias $Y_i\ (i=1,\ldots,n)$ , sabía que

$$\mathbb{P}\left( \frac{1}{n} \left(Y_1+\cdots+Y_n\right) \ge \mathbb{E}\left[Y\right] + t \right) \le \exp\left( - n\cdot C_1 t^2 \right).$$

Además, como $Y_i^2\ (i=1,2,\ldots,n)$ son sub-exponencial También sabía que

$$\mathbb{P}\left( \frac{1}{n} \left(Y_1^2+\cdots+Y_n^2\right)\ge \mathbb{E}\left[ Y^2 \right] + t \right) \le \exp\left( - n\cdot \min(C_1 t^2, C_2 t) \right).$$

Estas dos desigualdades pueden demostrarse mediante un límite de Chernoff, ya que las funciones generadoras de momentos de $Y$ (subgaussiano) y $Y^2$ (subexponencial) ambos existen.

Sin embargo, quiero saber si existe una desigualdad como

$$\mathbb{P}\left( \frac{1}{n} \left( Y_1^4+\cdots+Y_n^4 \right) \ge \mathbb{E}\left[Y^4\right] + t \right) \le C \exp\left( - n \cdot \min\left( C_1 t^2, C_2 t, C_3 \sqrt{t} \right) \right),$$

aunque la función generadora de momentos de $Y^4$ (cuadrado del subexponencial) no existe.

0 votos

¿Has comprobado la Ec. (2.20), en la p.20 de este ? [ "Estadística de alta dimensión: Un punto de vista no asintótico",. por M. Wainwright. Capítulo 2, 2015]; o la propuesta 5.16 de estas notas [ "Introducción al análisis no asintótico de matrices aleatorias", Roman Vershynin, 2011]

0 votos

Para el cuadrado de una v.r. gaussiana estándar, que es subexponencial con parámetros $(2,4)$ También debería echar un vistazo a los ejemplos 2.4 y 2.5 de la primera referencia citada.

0 votos

@ClementC. Muchas gracias por tu respuesta. Supongo que querías decir que realmente "existe" una desigualdad de concentración para variables subexponenciales. Sin embargo, lo que me pregunto es si existe una desigualdad para "el cuadrado de las variables subexponenciales". Ver mi comentario de arriba, editado sólo saber.

8voto

A.S. Puntos 2861

No. Para i.i.d. no negativo. $Y_i$ , $$P(Y_1\ge (\mu+t)n)\le P\Bigg(\sum_{i=1}^n Y_i\ge (\mu+t)n\Bigg)\le\exp(-nf(t))$$ implica que $Y_1$ es subexponencial y un cuadrado de una subexponencial no está garantizado que sea subexponencial.

Sin embargo, puede obtener $$P(X_1^2+\dots+X_n^2>nt)\sim nP(X_1^2>nt)=n\exp(-\lambda\sqrt {nt})$$ para $X_i\sim \exp(\lambda)$ que se puede extender a todos los subexponenciales $X_i$ que tienen colas exponenciales.

2 votos

¿Cómo se obtiene el límite de la distribución exponencial al cuadrado?

1 votos

¿Podría proporcionar más detalles sobre el $P(X_1^2+\cdots+X_n^2 > nt) \sim nP(X_1^2>nt)$ ¿parte? Estoy tratando de averiguar la inducción. Gracias.

0 votos

Este es el hecho conocido/estándar de la teoría general de las distribuciones de cola pesada. A grandes rasgos, la suma está dominada por la más pesada.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X