Actualmente estoy tratando de encontrar a un conocido de distribución que se ajusta a mi positivo sesgada conjunto de datos (n=70) el mejor. Primero he utilizado el fitdistrplus
paquete de R para estimar los parámetros de Gamma, Weibull, Lognormal y distribuciones Exponenciales (mediante la estimación de Máxima Verosimilitud, aunque yo estoy seguro de si el MLE es la mejor opción con 70 observaciones (mejor?)).
En el segundo paso, he seleccionado el modelo con menor AIC. Pero, por supuesto, el modelo debe también pasar por una bondad de ajuste de la prueba. La primera idea fue simplemente el uso de un Kolmogorv-Smirnov con el parámetro estimado, pero esto no parece ser una buena idea, ya KS-Pruebas con parámetros estimados conducir a más o menos inútil valores de "p".
Durante mi búsqueda en la web, me tropecé con Greg Nieves' sugerencia y aparte de que a través de esta página que describe un interesante método de monte carlo (de Clauset et al.). Un ejemplar adaptado R código de ejemplo que utiliza la fitdistrplus
paquete para la estimación de máxima verosimilitud para el registro de la norma de distribución es como sigue:
lognormal = function(d, limit=2500) {
# MLE for lognormal distribution
fit <- fitdist(d,"lnorm", method="mle")
# compute KS statistic
t = ks.test(d, "plnorm", meanlog = fit$estimate["meanlog"], sdlog = fit$estimate["sdlog"]);
# compute p-value
count = 0;
for (i in 1:limit) {
syn = rlnorm(length(d), meanlog = fit$estimate["meanlog"], sdlog = fit$estimate["sdlog"]);
fit2 <- fitdist(syn, "lnorm", method="mle")
t2 = ks.test(syn, "plnorm", meanlog = fit2$estimate["meanlog"], sdlog = fit2$estimate["sdlog"]);
if(t2$stat >= t$stat) {count = count + 1};
}
return(list(meanlog = fit$estimate["meanlog"], sdlog = fit$estimate["sdlog"], stat = t$stat, p = count/limit, KSp = t$p));
}
Lo que actualmente estoy preguntando a mí (y a usted), no hace que este enfoque tiene sentido con respecto al tamaño pequeño de la muestra (o debo usar el momento/... estimadores o es MLE aceptar) y es la forma en que la bondad de ajuste se prueba el adecuado?