Va a ser difícil incluso para definir lo que significa "el error de medición de un máximo de cuenta".
En caso de que de media es fácil, porque significa que es un parámetro de teórico de base de distribución que genera los datos. Este parámetro puede ser estimado junto con su incertidumbre.
Máximo, por otro lado, es no un parámetro de la distribución - la distribución no tiene máximo! Así que cuando usted habla de la máxima, es siempre el máximo de la muestra.
Esto pone a la estadística Bayesiana fuera porque considera que sus datos como fijo. Usted tendrá que utilizar un enfoque frecuentista, que considera el modelo como fijo y que sus datos sean realmente muestra de su modelo. La inferencia puede ser directa o mediante el uso de bootstrap. Yo no soy muy fuerte en la obtención de complejos frecuentista de probabilidad máxima de las fórmulas, así que me limitaré a dar un arranque de ejemplo en sus datos:
library(boot)
counts <- data.frame(year = sort(rep(2000:2009, 12)), month = rep(month.abb,10), count = sample(1:500, 120, replace = T))
# this is how you compute the maximum
aggregate(counts$count, list(counts$month), max)
# function which does it for a sub-sample given by `indices`
month_max <- function (data, indices) {
d <- data[indices,] # allows boot to select sample
return (tapply(d$count, d$month, max))
}
# bootstrapping with 1000 replications
results <- boot(data=counts, statistic=month_max, R=1000)
results
# ORDINARY NONPARAMETRIC BOOTSTRAP
# [...]
# Bootstrap Statistics :
# original bias std. error
# t1* 466 -28.364 48.41140
# t2* 496 -27.725 40.78849
# t3* 455 -40.789 57.09997
# t4* 499 -32.997 47.74439
# t5* 466 -15.057 34.23477
# t6* 484 -15.966 39.79838
# t7* 491 -24.337 38.84459
# t8* 370 -24.701 39.31971
# t9* 474 -28.850 57.94352
# t10* 448 -23.793 59.52596
# t11* 446 -64.173 84.13633
# t12* 398 -22.229 36.31511
Puede ver los resultados corresponden a los valores reales, pero también incluyen un error estándar. Se puede ver que el sesgo es bastante alto. Esto indica que el "verdadero" valor máximo se encuentra fuera de la muestra, lo cual es normal para max
función y no va a suceder por mean
.
Usted puede reportar el CI demasiado (tal vez hay una mejor manera, pero esto funciona):
for (i in 1:12) {
print(boot.ci(results, type="bca", index=i))
}