Dejemos que $\{X_1,\ldots,X_n\}$ sean variables aleatorias discretas independientes e idénticamente distribuidas. Me interesa calcular la probabilidad del evento de que la muestra esté libre de duplicados: $$ \mathbb{P}\left( \bigcap_{i<j} \{ X_i \not= X_j\}\right) $$ en términos de $p_2 = \mathbb{P}\left(X_1 = X_2\right)$ , $p_3=\mathbb{P}\left(X_1 = X_2 = X_3\right)$ , ..., $p_n = \mathbb{P}\left(X_1 = X_2 = X_3=\ldots=X_n\right)$ .
Caso especial
Si $X_k$ se distribuyen uniformemente, siendo el tamaño del espacio muestral $d$ Este es un clásico problema de cumpleaños con la respuesta: $$ \mathbb{P}\left( \bigcap_{i<j} \{ X_i \not= X_j\}\right) = \frac{n!}{d^n} \binom{d}{n} = \sum_{k=1}^n \frac{s(n,k)}{d^{n-k}} $$ donde $s(n,k)$ denota el número de Stirling del primer tipo.
Motivación
Considere Número de punto flotante IEEE con mantisa $m$ codificado como $d$ -tupla de significativo dígitos binarios (es decir, el primer bit es siempre 1), y exponente binario entero $e$ . Para un real aleatorio $0<x<1$ los bits son variables aleatorias iid Bernoulli(1/2), y $-e$ es una variable aleatoria Geométrica(1/2). Me interesa calcular la probabilidad del tamaño $n$ muestra que tiene un duplicado.
Mi enfoque
Aplicando el principio de inclusión-exclusión, la probabilidad complementaria es $$ \sum_{i<j} \mathbb{P}\left(X_i = X_j\right) - \sum_{i<j,i<p<q} \mathbb{P}\left(X_i = X_j, X_p=X_q\right)+\ldots = \\ \binom{n}{2} p_2 - 3 \binom{n}{4} p_2^2 - 2 \binom{n}{3} p_3 + \ldots $$
Soluciones, ideas y referencias son bienvenidas.