4 votos

Límite de desviación grande para la norma cuadrada de la suma de dos variables aleatorias

Quiero plantear esta pregunta lo más general posible y pedir referencias sobre qué hacer en situaciones similares. Incrementaré gradualmente los detalles para acotar el problema.


Quiero derivar un límite de desviación grande para $\| X + Y \|_2^2$, donde $X$ y $Y$ son vectores dependientes de $p$ dimensiones; creo que en mi situación es imposible computar los cuantiles de $Z = \| X + Y \|_2^2$. Formalmente, quiero obtener algo como $$ \mathbb{P}( \| X + Y \|_2^2 > \lambda(x)) \le e^{-x}, $$ donde $\lambda(x)$ es una función determinística de $x$ y características de $X$ y $Y$.

¿Hay técnicas generales, enfoques o formas de pensar en esta situación más genérica?


Detalle 1. Sé que $Y \sim \mathcal{N}(0, \mathbf\Sigma)$.

Detalle 2. Sé que $\mathbb{E} \| X \|_2^2 \le \Delta$, para un $\Delta$ fijo.

Detalle 3. Sé que la magnitud de $Y$ es mucho mayor que la de $X$, pero no puedo deducir formalmente la desigualdad mencionada anteriormente a algo similar a $$ \mathbb{P}(\| Y \|_2^2 \ge \lambda_Y(x)) \le e^{-x}. $$ Sin embargo, sé que $\lambda(x)$ debería ser grande solo debido a $Y$ y no a $X$.

Observa que si se permite que $\lambda(x)$ sea aleatorio, entonces la elección $\lambda(x) = \lambda_Y(x) + \| X \|_2 + 2X^\top Y$ funcionaría perfectamente.


Agradecería cualquier idea, sugerencia y/o comentario.

0 votos

Necesitas una secuencia indexada de distribuciones para tener una LDP. Parece que tienes algún parámetro $x$. ¿Es este un parámetro de escala de desviaciones grandes? ¿Cuál es la ley de los grandes números para la secuencia?

0 votos

¿Puedes simplemente usar eso si $\|X+Y\| \geq \lambda$, entonces $\|Y\| \geq \lambda - \Delta$, y luego usar que $Y$ es distribuido normalmente?

0 votos

@snar, sí, $x$ es un parámetro de escala, cuanto mayor sea $x$, menor será la probabilidad. En realidad, no tengo ninguna secuencia de distribuciones, pero no creo que sea un problema, ya que por ejemplo para $Y \sim \mathcal{N}(0, \mathbf{\Sigma})$ sé exactamente cómo se ven los límites de concentración. Ahora, la pregunta de manera informal es ¿qué pasa si este $Y$ está corrompido con otro vector $X$ y quiero límites de concentración similares en la norma de su suma.

1voto

Mat Puntos 155

Esto fue demasiado largo para un comentario, pero no es una respuesta.

Primero, a menos que tengas alguna escala LLN para $\lambda(x)^{-1}(\|X+Y\|^2)$, la teoría de grandes desviaciones me parece solo tangencialmente relacionada a través de las técnicas que utiliza. Si hay un LDP legítimo aquí, entonces una forma obvia de proceder es a través del principio de contracción usando algo como la transformación $T(x,y) = (x+y)^2$.

Luego, como señala PhoemueX, si sabes algo como $\|Y\| \geq \|X\|$ casi seguro, entonces la respuesta es bastante directa. Tendríamos, para cualquier $t>0$: \begin{align*} P(\|X+Y\|^2 \geq \lambda (x)) &= P(e^{t\|X+Y\|^2} \geq e^{t\lambda(x)}) \\ &\leq e^{-t\lambda(x)} E[e^{t(\|X\|^2+\|Y\|^2+2 X^T Y)}]\\ &= e^{-t\lambda(x)} E[e^{t(\|Y\|^2+\|Y\|^2+2 \|Y\|^2)}]\\ &= e^{-t\lambda(x)} E[e^{4t \|Y\|^2}]. \end{align*} Dado que $Y$ es un vector gaussiano con media cero y matriz de covarianza $\Sigma$, podemos identificar la distribución de la suma de cuadrados. Si por ejemplo, $\Sigma = I$ es diagonal, entonces $\|Y\|^2$ es $\chi^2$, y puedes evaluar la función generadora de momentos como $(1-2t)^{-p/2}$. Optimizando sobre $t>0$, obtendríamos: \begin{align*} P(\|X+Y\|^2 \geq \lambda (x)) &\leq \inf_{t>0} e^{-t\lambda(x)-(p/2)\log(1-2(4t))}, \end{align*} lo que equivale a optimizar $$\sup_{t>0} \bigg(\lambda(x) - \frac{p}{2} \log(1-8t)\bigg).$$ La notación $\asymp$ significa diferentes cosas dependiendo del contexto, así que debes aclarar. Si no tienes la desigualdad casi segura escrita arriba, entonces probablemente puedes usar alguna combinación de Jensen y Holder para obtener una desigualdad cruda que sea lo que deseas.

0 votos

$\asymp$ es $\Theta(\cdot)$, es decir, cuando escribo $\| X \| \asymp \alpha$ significa que $c_1 \alpha \le \| X \| \le c_2 \alpha$ para constantes positivas $c_{1, 2}$.

0 votos

Entiendo la idea general, gracias. Obtengo algo diferente, pero no es crucial. Sin embargo, no tengo $\| Y \| \ge \| X \|$ casi seguramente, pero creo que intentaré utilizar este enfoque utilizando $\| Y \| \ge \| X \|$ con alta probabilidad.

0 votos

Es probable que haya calculado mal algunas cosas. Definitivamente puedes dividir en conjuntos "buenos" y "malos" $\{\|X\| \geq \|Y\|\}$ y $\{\|X\| \leq \|Y\|\}$. Dadas las desigualdades muy fuertes que tienes de tus relaciones $\asymp$, deberías poder obtener la desigualdad deseada.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X