Considere $n$ variables aleatorias de varianza unitaria $X_1, X_2, \ldots X_n$ con la propiedad de que $\operatorname{cov}(X_i,X_j) = q$ para todos $i \neq j$ . Entonces, la matriz de covarianza de estas variables aleatorias es la misma que la matriz de correlaciones. Ahora $$\begin{align*} \operatorname{var}(X_1+X_2+\cdots+X_n) &= \sum_{i=1}^n \operatorname{var}(X_i) + 2\sum_{i=1}^n\sum_{j=i+1}^n\operatorname{cov}(X_i,X_j)\tag{1}\\ &= n + n(n-1)q\\ &\geq 0 \end{align*}$$ y por eso debe ser que $$q \geq -\frac{1}{n-1}$$ como señaló Michael Hardy en un sucinto comentario sobre la cuestión. El límite superior es, por supuesto, $q \leq 1$ . Ambos límites son alcanzables. Obviamente, si todos los $X_i$ son los même variable aleatoria $X$ entonces $q = 1$ . Para el límite inferior, supongamos que el $X_i$ son independiente variables aleatorias de varianza unitaria para que disfruten de la constante deseada correlación con $q=0$ . Para cada $i$ , set $Y_i = X_i-\bar{X}$ donde $$\bar{X} = \frac{1}{n}\sum_{i=1}^n X_i.$$ Entonces, $$\operatorname{var}(Y_i) = \left(\frac{n-1}{n}\right)^2 + (n-1)\left(\frac{1}{n}\right)^2 = \frac{n-1}{n}$$ mientras que para $i \neq j$ , $$\begin{align} \operatorname{cov}(Y_i,Y_j) &= \operatorname{cov}(X_i - \bar{X}, Y_j- \bar{X})\\ &= \operatorname{cov}(X_i,X_j) - \operatorname{cov}(X_i,\bar{X}) - \operatorname{cov}(X_j,\bar{X})+ \operatorname{var}(\bar{X})\\ &= 0 - \frac{1}{n} - \frac{1}{n} + \frac{1}{n}\\ &= -\frac{1}{n} \end{align}$$ mostrando que todos los coeficientes de correlación tienen efectivamente el valor mínimo $$ \frac{-1/n}{\sqrt{(n-1)/n}\sqrt{(n-1)/n}} = -\frac{1}{n-1}.$$
Volviendo a $(1)$ , obsérvese que si los coeficientes de correlación son no se requiere que todos tengan el mismo valor, entonces de $(1)$ obtenemos que la suma de las $n(n-1)$ las correlaciones deben ser al menos $-n$ . Así, el media de la $n(n-1)$ correlaciones es al menos $-1/(n-1)$ y como al menos una correlación debe ser tan grande como la media, podemos afirmar que
En cualquier colección de $n$ variables aleatorias $X_1, X_2, \ldots, X_n$ con varianza finita, debe haber al menos un par de variables aleatorias $(X_i,X_j)$ (con $i\neq j$ ) para que $$\operatorname{cov}(X_i,X_j) \geq -\frac{1}{n-1}$$