Supongamos que $X_1, X_2, \ldots, X_n$ son independientes y cada una tiene la misma distribución con un sub-exponencial variable aleatoria $X$ (por ejemplo, $X$ es el cuadrado de una variable gaussiana normal estándar). ¿Puedo obtener una desigualdad de concentración para el cuadrado de la sub-exponencial $X_i$ digamos,
$$\mathbb{P}\left( \frac{1}{n} \left( X_1^2+\cdots+X_n^2 \right) \ge \mathbb{E}\left[X^2\right] + t \right) \le C \exp\left( - n \cdot \min\left( C_1 t^2, C_2 t, C_3 \sqrt{t} \right) \right),$$
donde $C, C_1, C_2, C_3$ ¿son constantes?
Este problema se plantea en mi investigación.
Observación:
En realidad, para el i.i.d. sub-Gaussiano variables aleatorias $Y_i\ (i=1,\ldots,n)$ , sabía que
$$\mathbb{P}\left( \frac{1}{n} \left(Y_1+\cdots+Y_n\right) \ge \mathbb{E}\left[Y\right] + t \right) \le \exp\left( - n\cdot C_1 t^2 \right).$$
Además, como $Y_i^2\ (i=1,2,\ldots,n)$ son sub-exponencial También sabía que
$$\mathbb{P}\left( \frac{1}{n} \left(Y_1^2+\cdots+Y_n^2\right)\ge \mathbb{E}\left[ Y^2 \right] + t \right) \le \exp\left( - n\cdot \min(C_1 t^2, C_2 t) \right).$$
Estas dos desigualdades pueden demostrarse mediante un límite de Chernoff, ya que las funciones generadoras de momentos de $Y$ (subgaussiano) y $Y^2$ (subexponencial) ambos existen.
Sin embargo, quiero saber si existe una desigualdad como
$$\mathbb{P}\left( \frac{1}{n} \left( Y_1^4+\cdots+Y_n^4 \right) \ge \mathbb{E}\left[Y^4\right] + t \right) \le C \exp\left( - n \cdot \min\left( C_1 t^2, C_2 t, C_3 \sqrt{t} \right) \right),$$
aunque la función generadora de momentos de $Y^4$ (cuadrado del subexponencial) no existe.
0 votos
¿Has comprobado la Ec. (2.20), en la p.20 de este ? [ "Estadística de alta dimensión: Un punto de vista no asintótico",. por M. Wainwright. Capítulo 2, 2015]; o la propuesta 5.16 de estas notas [ "Introducción al análisis no asintótico de matrices aleatorias", Roman Vershynin, 2011]
0 votos
Para el cuadrado de una v.r. gaussiana estándar, que es subexponencial con parámetros $(2,4)$ También debería echar un vistazo a los ejemplos 2.4 y 2.5 de la primera referencia citada.
0 votos
@ClementC. Muchas gracias por tu respuesta. Supongo que querías decir que realmente "existe" una desigualdad de concentración para variables subexponenciales. Sin embargo, lo que me pregunto es si existe una desigualdad para "el cuadrado de las variables subexponenciales". Ver mi comentario de arriba, editado sólo saber.
0 votos
Tienes razón, entendí mal lo que preguntabas.
3 votos
No. $P(\frac {X_1^2}n\ge t)=\Omega(\exp(-\lambda \sqrt t\sqrt n))$ . Una vez que su variable es fuertemente no-sub-exponencial, el máximo de la suma se alcanza para una sola probabilidad de desviación grande de la cual ya no escala como $\exp(-\alpha n)$ .
2 votos
Dicho esto, debería poder encontrar un $\exp(-C\sqrt n \sqrt t)$ tipo de límite con algún pre-factor polinómico.
0 votos
Cuando $X$ es una subgaussiana, se consigue una gran desviación en torno a que todos los sumandos sean aproximadamente iguales. Sub-exponencial - aproximadamente uniforme en un simplex. Ley de potencia - en las esquinas (contribuciones de 1 desviación grande solamente).
0 votos
Más concretamente, si $X\overset{d}=\exp(\lambda)$ entonces $P(X_1^2+\dots+X_n^2>nt)\sim nP(X_1^2>nt)=n\exp(-\lambda\sqrt {nt})$ lo que produce un comportamiento asintótico.
0 votos
@A.S. Por el bien de la pregunta (y de la recompensa), ¿puedes publicar eso como respuesta?