Tengo algo más de dispersión de los datos y estoy tratando de decidir qué modelo se adapta mejor a los datos. Los datos son generalmente de cargos de los síntomas o el número de elementos correctos en algunas tareas cognitivas. Como un ejemplo:
set.seed(69)
g1<-rnorm(700,30,9); g2<-rnorm(100,25,7); g3<-rnorm(100,20,5)
gt<-data.frame(score=c(g1, g2, g3), fac1=factor(rep(c("a", "b", "c"), c(700, 100, 100))), fac2=ordered(rep(c(0,1,2), c(3,13,4))))
gt$score<-with(gt, ifelse(fac2 == 0, score, score-rnorm(1, 0.5, 2)))
gt$score<-with(gt, ifelse(fac2 == 2, score-rnorm(1, 0.5, 2), score))
gt$score<-round(with(gt, ifelse(score>=30, 30, score)))
gt$cov1<-with(gt, score + rnorm(900, sd=40))/40
gt$score.30<-with(gt, 30-score)
Los modelos que estoy pensando en usar son:
glmnb1<-glm.nb(score.30~cov1 + fac1*fac2, data=gt)
hur1<-hurdle(score.30~cov1 + fac1*fac2, dist="negbin", data=gt)
quasi1<-glm(cbind(score, score.30)~cov1+fac1*fac2, family="quasibinomial", data=gt)
- Cómo decidir entre la binomial negativa y la quasibinomial?
- En este ejemplo, el obstáculo es un modelo de mejor ajuste en comparación con la binomial negativa. Sin embargo, si el quasibinomial fue mejor en comparación a la binomial negativa (hipotéticamente o de otra manera), ¿cómo se compara el obstáculo y quasibinomial? Hay un obstáculo quasibinomial?