Comentario ampliado y corregido. Para el Problema como se dijo anteriormente la independencia es más importante de lo que pretendía. (Para simplificar el problema aplicado, he reducido el número de cajas y el número de ensayos del problema original aplicado, con resultados imprevistos).
Suponiendo que las cajas son independientes da efectivamente 28 como percentil 99 para el número máximo $W$ de bolas en la caja más llena. Sin embargo, una simulación de la situación real descrita, muestra que el percentil 99 de $W$ es 31, y que la correlación de los números de bolas en dos cajas diferentes es de aproximadamente $r = -0.11.$
En la simulación que se muestra a continuación, utilizando el software estadístico R, el juego se "juega" 10.000 veces. Para cada jugada del juego, la matriz MAT
tiene $50$ filas (ensayos) y $10$ columnas (casillas). Cada elemento de la matriz es 1 o 0 según la caja haya recibido una bola en el ensayo correspondiente, o no. Todas las filas suman 4.
set.seed(1776) # change seed for different simulation
games = 10000; w = r = numeric(games)
for (k in 1:games)
{
trials=50; boxes=10
MAT=matrix(rep(0, trials*boxes), nrow=trials)
for (i in 1:trials) {
MAT[i,] = sample(c(1,1,1,1,0,0,0,0,0,0), boxes) }
w[k] = max(colSums(MAT))
r[k] = cor(MAT[,1],MAT[,2])
}
quantile(w, .99)
## 99%
## 31
mean(r)
## -0.1139328
Las simulaciones repetidas dieron exactamente 31 para el percentil 99 de $W,$ y casi una correlación media de -0,11 entre los contenidos de la primera y la segunda columna. La figura siguiente muestra la distribución simulada de distribución de $W.$
Gracias a @MichaelSiefert y @RossMillikan por sus útiles discusiones de este problema.