De los Xt=j unidades no muestreadas en el tiempo t, el número que aún no se han muestreado en el tiempo t+1 sigue una distribución hipergeométrica con parámetros N, N−M e i. Las probabilidades de transición de esta cadena de Markov están dadas por p_{ij}=P(X_{t+1}=j|X_t=i)=\frac{{i \choose j}{N-i \choose N-M-j}}{{N \choose N-M}}. Sea k_i la cantidad esperada de tiempo restante hasta que todas las unidades estén muestreadas dado que el estado actual es X_t=i. Entonces tenemos que k_0=0 y, por la ley de la expectativa total, k_i = 1 + \sum_{j=0}^i p_{ij} k_j. El siguiente código en R resuelve estas ecuaciones y calcula k_1,k_2,\dots,k_{10} para M=2 y N=10.
expectation <- function(M,N) {
k <- NULL # k_1, k_2, ...
for (i in 1:N) {
p <- dhyper(1:i, N-M, M, i) # probabilidades de transición
k[i] <- (1 + sum(p[-i]*k))/(1 - p[i]) # solución de k_i = 1 + sum p_ij k_j
}
k
}
> expectation(2,10)
[1] 5.000000 7.352941 8.933824 10.117647 11.065126 11.854557 12.531270
[8] 13.123362 13.649689 14.123362