Considere la siguiente fórmula :
$$p_i=\sum_{j=1}^n\frac{\binom{i-1}{j-1}\binom{n^2-i}{n-j}}{\binom{n^2}{n}},$$
donde $i,n$ son enteros positivos y $i=1,\ldots,n^2$.
Supongamos que hay $n$ (cajas de las cajas con la etiqueta de la $1,2,\ldots,n$), cada uno con $n$ bolas. Las bolas en cada cuadro se ordenan de acuerdo a su tamaño. El $i$th $(i=1,2,\ldots,n^2)$ más pequeña pelota de entre todos los $n^2$ bolas es el $j$th más pequeña bola de $(j=1,2,\ldots,n)$ de un cuadro si y sólo si (1) la primera $(i-1)$ valores contienen exactamente $(j-1)$ 1. Esto se puede hacer en $\binom{i-1}{j-1}$ formas, $(2)$ $i$th valor es un porcentaje ( $1$ , (3) Y por lo tanto no son exactamente $(n-j)$ 1 se distribuye entre el resto de los $(n^2-i)$ valores. Esto se puede hacer en $\binom{n^2-i}{n-j}$ maneras.
El número total de maneras en que el $n^2$ bolas pueden ser asignados al azar a $n$ cajas de es $\binom{n^2}{n}$.
Entonces la probabilidad de que el $i$th más pequeña pelota de entre todos los $n^2$ bolas es el $j$th más pequeña bola de una caja que es
$$\frac{\binom{i-1}{j-1}\binom{n^2-i}{n-j}}{\binom{n^2}{n}}.$$
Seleccionamos un balón, si éste es el $1$st bolas más pequeños de la $1$st cuadro, o $2$nd bolas más pequeños de la $2$nd de caja, lo $n$th bolas más pequeños de la $n$th cuadro. No es posible que el $i$th más pequeña bola en general fue en dos cajas, pero tenía que ser en algún cuadro. Por lo tanto, el caso de que "el $i$th más pequeña bola estaba en el cuadro de $j$", es una partición exhaustiva de las posibilidades. En consecuencia, hay posibilidades de sumar. Por lo tanto la probabilidad de que el $i$th más pequeña bola es seleccionada es
$$p_i=\sum_{j=1}^n\frac{\binom{i-1}{j-1}\binom{n^2-i}{n-j}}{\binom{n^2}{n}}.$$
Yo esperaba diferente valor de $p_i$ diferentes $i$. Pero yo estaba asombrado de que la $p_i$ es el mismo para todos los $i$.
Parece
$$p_i=\sum_{j=1}^n\frac{\binom{i-1}{j-1}\binom{n^2-i}{n-j}}{\binom{n^2}{n}}=\frac{1}{n}.$$
Lo he comprobado mediante el cálculo de $p_i$ diferentes $n$ como $2$ o $3$.
¿Cuál es la razón por la que $p_i$ no depende de $i$?
¿Por qué esta fórmula compleja que no es nada pero un uniforme de probabilidad?