Considerando el conocido escenario multinomial: hay L bolas, lanzadas al azar en n contenedores, de modo que la probabilidad de que una bola caiga en el contenedor i es $p_i$, independientemente de las otras bolas (los $p_i$ son todos positivos y suman 1).
Sea $X_i$ el número de bolas en el contenedor i. Es fácil mostrar que para cualquier k índices distintos $i_1, i_2,\ldots, i_k$, los eventos $\lbrace X_{i_1} > 0\rbrace, \lbrace X_{i_2} > 0\rbrace,\ldots, \lbrace X_{i_k} > 0\rbrace$ son negativamente dependientes en el sentido de que
$P(X_{i_1} > 0, X_{i_2} > 0,\ldots, X_{i_k} > 0) < P(X_{i_1} > 0)P(X_{i_2} > 0)\ldots P(X_{i_k} > 0)$
La demostración es por inducción sobre k: para k = 2, la probabilidad en el lado izquierdo es $1 – [(1 - p_{i_1})^L + (1 - p_{i_2})^L - (1 - p_{i_1} - p_{i_2})^L]$, y en el lado derecho es $[1 - (1 – p_{i_1})^L] [1 - (1 – p_{i_2})^L]$. Manipulaciones elementales muestran que la desigualdad se cumple, y el paso de la inducción se prueba fácilmente usando la regla de multiplicación $P(A \cap B) = P(A)P(B | A)$.
Esta dependencia negativa también es intuitivamente clara: si sabemos que hay al menos una bola en el contenedor i, hay al menos una bola que seguramente no caerá en el contenedor j, por lo que la probabilidad de que el contenedor j esté vacío disminuye.
Así que eso fue fácil. Sin embargo, para demostrar cierto límite en mi investigación, necesito hacer algo similar, pero para índices k aleatorios: supongamos que después de que las bolas fueron lanzadas a los contenedores, alguien viene y elige aleatoriamente k contenedores distintos (para que cada conjunto de k contenedores tenga la misma probabilidad de ser elegido, es decir, 1/(n elija k)). Sean $i_1, i_2, \ldots, i_k$ los índices elegidos, y nuevamente, necesito mostrar que la desigualdad (abajo del segundo párrafo anterior) se cumple.
Pensé en repetir el esquema de la demostración anterior, pero tuve un problema al probar el caso k = 2 (el paso de la inducción no es un problema). Para calcular cada lado de la desigualdad condicioné la elección de los dos índices (ley de la probabilidad total), pero a pesar de que muchos términos se cancelaron, no pude probar la desigualdad.
Estoy bastante seguro de que la desigualdad se cumple, tanto por intuición (básicamente el mismo argumento que en el caso de índices no aleatorios) como por cálculos numéricos.
¿Alguna idea de qué hacer aquí? Agradecería cualquier ayuda.