42 votos

Desigualdad para el valor esperado

Un colega vino a mi oficina esta tarde y me hizo la siguiente pregunta. Me ha dicho que hay una prueba inteligente cuando $n=2$ . No pude hacer nada con él, así que pensé en publicarlo aquí y ver qué pasa.

Demostrar o encontrar un contraejemplo

Para variables aleatorias positivas, i.i.d. $Z_1,\dots, Z_n$ con media finita, y constantes positivas $a_1,\dots, a_n$ , tenemos $$\mathbb{E}\left({\sum_{i=1}^n a_i^2 Z_i\over\sum_{i=1}^n a_i Z_i}\right) \leq {\sum_{i=1}^n a_i^2\over\sum_{i=1}^n a_i}.$$


Añadido: Este problema tiene su origen en la tesis de un estudiante de Ingeniería Informática y Eléctrica de la Universidad de Alberta. He aquí la respuesta de su supervisor: "¡Muchas gracias por esto! Es un buen resultado, además de ser útil en un problema práctico de colocación de antenas".

23voto

codeConcussion Puntos 7250

Sí, la desigualdad siempre se mantiene para variables aleatorias i.i.d. $Z_1,\ldots,Z_n$ . De hecho, como sugieren Yuval y joriki, basta con suponer que la distribución conjunta es invariante bajo la permutación de las $Z_i$ . Reordenando ligeramente la desigualdad, sólo tenemos que demostrar que lo siguiente es no negativo (aquí, estoy usando $\bar a\equiv\sum_ia_i^2/\sum_ia_i$ ) $$ \bar a-\mathbb{E}\left[\frac{\sum_ia_i^2Z_i}{\sum_ia_iZ_i}\right]=\sum_ia_i(\bar a-a_i)\mathbb{E}\left[\frac{Z_i}{\sum_ja_jZ_j}\right]. $$ Voy a escribir $c_i\equiv\mathbb{E}[Z_i/\sum_ja_jZ_j]$ por brevedad. Entonces, observando que $\sum_ia_i(\bar a-a_i)=0$ eligiendo una constante cualquiera $\bar c$ que nos gusta, $$ \bar a-\mathbb{E}\left[\frac{\sum_ia_i^2Z_i}{\sum_ia_iZ_i}\right]=\sum_ia_i(\bar a-a_i)(c_i-\bar c). $$ Para demostrar que es no negativo, basta con mostrar que $c_i$ es una función decreciente de $a_i$ (es decir, $c_i\le c_j$ siempre que $a_i\ge a_j$ ). En ese caso, podemos elegir $\bar c$ para que $\bar c\ge c_i$ siempre que $a_i\ge\bar a$ y $\bar c\le c_i$ siempre que $a_i\le\bar a$ . Esto hace que cada término de la suma final anterior sea positivo y completa la prueba.

Elección de $i\not=j$ tal que $a_i \ge a_j$ , $$ c_i-c_j=\mathbb{E}\left[\frac{Z_i-Z_j}{\sum_ka_kZ_k}\right] $$ Dejemos que $\pi$ sea la permutación de $\{1,\ldots,n\}$ que intercambia $i,j$ y deja todo lo demás fijo. Usando la invariancia bajo permutación $Z_i,Z_j$ , $$ \begin{align} 2(c_i-c_j)&=\mathbb{E}\left[\frac{Z_i-Z_j}{\sum_ka_kZ_k}\right]-\mathbb{E}\left[\frac{Z_i-Z_j}{\sum_ka_kZ_{\pi(k)}}\right]\cr &=\mathbb{E}\left[\frac{(a_j-a_i)(Z_i-Z_j)^2}{\sum_ka_kZ_k\sum_ka_kZ_{\pi(k)}}\right]\cr &\le0. \end{align} $$ Así que $c_i$ está disminuyendo en $a_i$ como se ha reclamado.


Nota: En el caso especial de $n=2$ siempre podemos hacer la elección $\bar c=(c_1+c_2)/2$ . Entonces, ambos términos de la suma en el lado derecho de la segunda ecuación mostrada arriba son iguales, dando $$ \bar a-\mathbb{E}\left[\frac{\sum_ia_i^2Z_i}{\sum_ia_iZ_i}\right]=\frac{a_1a_2(a_2-a_1)(c_1-c_2)}{a_1+a_2}. $$ Introduciendo mi expresión anterior para $2(c_1-c_2)$ da la identidad $$ \bar a-\mathbb{E}\left[\frac{\sum_ia_i^2Z_i}{\sum_ia_iZ_i}\right]=\frac{a_1a_2(a_1-a_2)^2}{2(a_1+a_2)}\mathbb{E}\left[\frac{(Z_1-Z_2)^2}{(a_1Z_1+a_2Z_2)(a_1Z_2+a_2Z_1)}\right], $$ que es manifiestamente no negativo. Supongo que esta podría ser la prueba "inteligente" mencionada en la pregunta.

Nota 2: La prueba anterior se basa en $\mathbb{E}[Z_i/\sum_ja_jZ_j]$ siendo una función decreciente de $a_i$ . Más generalmente, para cualquier disminución $f\colon\mathbb{R}^+\to\mathbb{R}^+$ entonces $\mathbb{E}[Z_if(\sum_ja_jZ_j)]$ es una función decreciente de $a_i$ . Elegir lo positivo $b_i$ y el ajuste $\bar a=\sum_ia_ib_i/\sum_ib_i$ entonces $\sum_ib_i(\bar a-a_i)=0$ . Aplicando el argumento anterior se obtiene la desigualdad $$ \mathbb{E}\left[f\left(\sum_ia_iZ_i\right)\sum_ia_ib_iZ_i\right] \le \mathbb{E}\left[f\left(\sum_ia_iZ_i\right)\sum_ib_iZ_i\right]\frac{\sum_ia_ib_i}{\sum_ib_i} $$ La desigualdad en la pregunta es el caso especial con $b_i=a_i$ y $f(x)=1/x$ .

3voto

John Fouhy Puntos 759

Desde el $Z_i$ son i.i.d., la expectativa es la misma si cambiamos el nombre de las variables. Tomando todas las permutaciones, su desigualdad es equivalente a $$ \mathbb{E} \left[ \frac{1}{n!} \sum_{\pi \in S_n} \frac{\sum_{i=1}^n a_i^2 Z_{\pi(i)}}{\sum_{i=1}^n a_i Z_{\pi(i)}} \right] \leq \frac{\sum_{i=1}^n a_i^2}{\sum_{i=1}^n a_i}. $$ Repasando todos los valores posibles de $Z_1,\ldots,Z_n$ Esto es lo mismo que la siguiente desigualdad para números reales positivos: $$ \frac{1}{n!} \sum_{\pi \in S_n} \frac{\sum_{i=1}^n a_i^2 z_{\pi(i)}}{\sum_{i=1}^n a_i z_{\pi(i)}} \leq \frac{\sum_{i=1}^n a_i^2}{\sum_{i=1}^n a_i}. $$ Intuitivamente, el máximo se alcanza en $z_i = \text{const}$ por lo que obtenemos el lado derecho. Esto es cierto para $n = 2$ que es fácil de comprobar directamente.

2voto

Sahas Katta Puntos 141

He estado jugando con un argumento de concavidad y el teorema de Jensen. Para $n=2$ Creo que esto funciona, como se muestra a continuación. Desafortunadamente, no funciona para $n > 2$ . De hecho, para $n > 2$ la restricción a cualquier conjunto convexo $x_1 + \dotsc + x_n = \lambda$ se puede demostrar que no cóncavo. Así que, aquí va el resultado parcial.

Dejemos que

$$ f(x_1, x_2) = \frac{a_1^2x_1 + a_2^2x_2}{a_1x_1+a_2x_2}. $$

Entonces $f$ restringido al segmento convexo $I=\{(x_1,x_2) \mid x_1,x_2 \geq 0 \textrm{ and } x_1+x_2=1\}$ es una función cóncava. Esto se puede comprobar de múltiples maneras, por ejemplo, calculando explícitamente la segunda derivada

$$ \frac{\partial^2}{\partial x^2} f(x, 1-x) = \frac{-2a_1a_2(a_1-a_2)^2}{(a_1x+a_2(1-x))^3} $$

y observando que es no positivo para $x \in [0,1]$ . Supongamos que la distribución conjunta de $(Z_1,Z_2)$ induce una distribución de probabilidad en $I$ entonces es simétrico bajo $(x_1,x_2) \mapsto (x_2, x_1)$ . En particular, los valores esperados para las coordenadas en $I$ son iguales y por lo tanto $\mathbb{E}(x_1) = \mathbb{E}(x_2) = \tfrac{1}{2}$ . Entonces, por el teorema de Jensen para funciones cóncavas sobre $I$ :

$$ \mathbb{E}(f(x_1,x_2)) \leq f(\mathbb{E}(x_1),\mathbb{E}(x_2)) = f(\tfrac{1}{2},\tfrac{1}{2}) = \frac{a_1^2+a_2^2}{a_1+a_2}. $$

Ahora $f$ es una función radial y el mismo razonamiento se aplica a todos los segmentos $x_1+x_2 = \lambda$ para $\lambda > 0$ . Y aunque la distribución inducida depende del parámetro $\lambda$ la desigualdad anterior se cumplirá para cada uno de estos segmentos y, por tanto, también para la distribución conjunta $(Z_1,Z_2)$ .

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X