No tengo una respuesta completa, pero sí una línea de pensamiento que podría resultar útil y que tengo la intención de ampliar cuando el tiempo lo permita.
Seguimiento de $n$ diferentes puntuaciones es obviamente difícil ya que $n$ se hace grande, por lo que pretendo hacer un seguimiento de sólo unas pocas estadísticas significativas y utilizar las distribuciones de probabilidad para calcular las expectativas.
En cualquier momento $t$ podemos dividir a los jugadores en dos grupos, los que han estado a la cabeza en algún momento, y los que no, pero en lugar de mantener las puntuaciones individuales de cada persona del grupo, podemos llevar la cuenta de tres estadísticas relevantes: $n_i$ el número de personas en el grupo, $\mu_i$ la puntuación media de las personas del grupo, y $\sigma_i$ la desviación estándar de las puntuaciones de las personas del grupo. Dejando $i=1$ ser el grupo que ha estado a la cabeza y $i=0$ ser las personas que no lo han hecho.
Ahora debemos averiguar cómo evolucionan estos números con el tiempo. En $t=1$ hay una persona con una puntuación de $1$ y todos los demás tienen una puntuación de $0$ así que nuestras estadísticas son $$t=1,\;\;\;n_1=1,\;\mu_1=1,\;\sigma_1=0,\;\;\;n_0=n-1,\;\mu_0=0,\;\sigma_0=0 $$ Después de cada competición, debemos ajustar estas estadísticas en función de quién haya ganado y luego comprobar si hay nuevos líderes. Cada grupo tiene una probabilidad $n_i/n$ de incluir al ganador, y el grupo con el ganador aumentará claramente la puntuación media, y posiblemente también la desviación estándar dependiendo de quién haya ganado en el grupo.
Ahora bien, si hubiéramos mantenido todas las puntuaciones $x_i$ de las personas de cada grupo simplemente incrementaríamos la puntuación del ganador $i$ por uno, $x_i^{t+1}=x_i^t+1$ ¿pero qué efecto tendría esto en nuestras estadísticas? $$\mu_t=\frac1n\sum_{i=1}^n{x_i}\;\;\;\;\;\sigma_t^2=\frac1n\sum_{i=1}^n{x_i^2}-\mu_t^2$$ Suponiendo que el jugador $1$ ganada por conveniencia calculemos los valores una vez $t+1$ $$\mu_{t+1} =\frac1n(x_1+1)+\frac1n\sum_{i=2}^n{x_i} =\frac1n{x_1}+\frac1n\sum_{i=2}^n{x_i}+\frac1n =\frac1n\sum_{i=1}^n{x_i}+\frac1n =\mu_t+\frac1n$$ Por lo tanto, el valor medio del grupo aumenta en uno dividido por el número de personas del grupo, independientemente de la persona que haya ganado, como cabría esperar. Ahora bien, ¿qué ocurre con la varianza? $$\sigma_{t+1}^2 =\frac1n(x_1+1)^2+\frac1n\sum_{i=2}^n{x_i^2}-\mu_{t+1}^2 =\frac1n(x_1^2+2x_1+1)+\frac1n\sum_{i=2}^n{x_i^2}-(\mu_t+\frac1n)^2$$ $$=\frac1n(x_1^2)+\frac1n\sum_{i=2}^n{x_i^2}+\frac1n(2x_1+1)-(\mu_t^2+\frac{2\mu_t}n+\frac1{n^2})$$ $$=\frac1n\sum_{i=1}^n{x_i^2}-\mu_t^2+\frac1n(2x_1+1-2\mu_t-\frac1n)$$ $$=\sigma_t^2+\frac1n(2x_1+1-2\mu_t-\frac1n)$$ Al contrario que con la media, seguimos teniendo un plazo $x_1$ de la izquierda, así que está claro que quién gane es importante. Y esto encaja bien con nuestra intuición de que si la persona más baja aumenta su puntuación, la varianza disminuye, pero si la persona con la puntuación más alta aumenta la varianza. Pero el valor esperado de $x_i$ es $\mu$ y, por lo tanto, a lo largo de muchos pasos de este tipo, supondremos que se equilibra y el $2x_1$ anula el término $2\mu$ término y nos quedamos con:- $$\sigma_{t+1}^2=\sigma_t^2+\frac1n(1-\frac1n)=\sigma_t^2+\frac1n-\frac1{n^2}$$ ¿Le parece razonable? Bueno, para $n=1$ (donde esperamos $\sigma$ para que siga siendo cero para todos los $t$ ) el $\frac1n$ y $\frac1{n^2}$ los términos se anulan, y $\sigma_{t+1}^2=\sigma_t^2$ como se desee. Para los grupos más grandes, estos términos son desiguales y hacen que la varianza aumente lentamente a medida que se juegan más partidas, como cabría esperar.
Si el ganador ha sido alguien del grupo de personas que nunca han estado en cabeza, ahora debemos estimar la probabilidad de que uno de ellos esté ahora en cabeza y, por tanto, deba pasar al otro grupo.
Como no hemos almacenado todas las puntuaciones individuales, las confeccionamos utilizando nuestras distribuciones, por lo que tenemos $n_0$ variables aleatorias $X_i$ con la distribución $F(\mu_0,\sigma_0)$ y $n_1$ variables aleatorias $Y_i$ con la distribución $F(\mu_1,\sigma_1)$ .
$\mathbb{P}($ La persona con mayor puntuación está en el grupo 0 $)=\mathbb{P}(X_{Max}>Y_{Max})$
$$X_{Max}=\max\limits_{i=1}^{n_0}(X_i), Y_{Max}=\max\limits_{i=1}^{n_1}(Y_i)$$ $$\mathbb{P}(X_{Max}\ge x)=(\mathbb{P}(X_i))^{n_0}$$ ¿Qué distribución debemos utilizar? Creo que la correcta es la distribución Binomial con $p=\frac1n$ podemos aproximarnos con la Normal debido a que n es grande, pero como p está relacionado con n puede que no sea lo mejor hacer esto ya que está sesgado. Además, la distribución normal no es muy fácil de encontrar las estadísticas de orden para, así que en su lugar voy a utilizar la distribución de Gumbel con la función de distribución acumulativa $$F(x)=e^{-e^{-x}}$$ Que tiene la bonita propiedad de que:- $$\mathbb{E}(X_{Max})=\mathbb{E}(X)+\frac{\sqrt{6\mathbb{Var}(X)}\log(n)}{\pi}=\mu_0+\frac{\sigma_0\sqrt6\log(n_0)}\pi$$
A continuación, calculamos el tiempo previsto para que alguien se desplace entre los grupos.
TODO:- calcular el efecto de que alguien cambie de grupo en las estadísticas
Por último, sumamos los tiempos previstos para todos los $n$ personas para entrar en el grupo de líderes.