¿Cómo es la Garvan?
El problema es que no sabemos cuántos cero que cuenta son observados. Tenemos la estimación de esta. Un clásico procedimiento estadístico para este tipo de situaciones es la Expectación-Maximización del algoritmo.
Un ejemplo sencillo:
Supongamos que sacamos de un desconocido de la población (de 1.000.000) con una distribución de poisson constante de 0.2.
counts <- rpois(1000000, 0.2)
table(counts)
0 1 2 3 4 5
818501 164042 16281 1111 62 3
Pero no podemos observar el cero de la cuenta. En su lugar podemos observar este:
table <- c("0"=0, table(counts)[2:6])
table
0 1 2 3 4 5
0 164042 16281 1111 62 3
Posibles frecuencias observadas
k <- c("0"=0, "1"=1, "2"=2, "3"=3, "4"=4, "5"=5)
Iniciar la media de la distribución de Poisson - acaba de tomar una conjetura (que sabemos que es de 0.2 aquí).
lambda <- 1
-
Expectativa Distribución De Poisson
P_k <- lambda^k*exp(-lambda)/factorial(k)
P_k
0 1 2 3 4 5
0.367879441 0.367879441 0.183939721 0.061313240 0.015328310 0.003065662
n0 <- sum(table[2:6])/(1 - P_k[1]) - sum(table[2:6])
n0
0
105628.2
table[1] <- 105628.2
-
Maximización
lambda_MLE <- (1/sum(table))*(sum(table*k))
lambda_MLE
[1] 0.697252
lambda <- lambda_MLE
-
Segunda iteración
P_k <- lambda^k*exp(-lambda)/factorial(k)
n0 <- sum(table[2:6])/(1 - P_k[1]) - sum(table[2:6])
table[1] <- n0
lambda <- (1/sum(table))*(sum(table*k))
Ahora iterar hasta que la convergencia:
[1,] 361517.1 0.5537774
Nuestra estimación de la población es 1003774 y nuestra tasa de poisson se estima en 0.1994473 - esta es la estimación de la proporción de la población muestreada. El principal problema que se tiene en los típicos problemas biológicos que se trata es suposición de que la tasa de poisson es una constante.
Lo siento por el largo aliento post - esta wiki no es realmente adecuado para R código.