Yo estoy comparando tres relativamente simple GLMs tener una distribución Gamma con el AIC y BIC. El objetivo es identificar los efectos de los fertilizantes (fdung), el año y el sitio de la biomasa de una determinada especie de pasto. Por tanto, el objetivo no es predecir nuevos valores, sino simplemente para identificar los efectos de los tres factores.
Aquí están los modelos utilizados:
res1 <- glm((Biomass..g.m².) ~ fdung * fyear * fblock, family=Gamma(link="identity"))
res2 <- glm((Biomass..g.m².) ~ fdung * fyear + fblock, family=Gamma(link="identity"))
res3 <- glm((Biomass..g.m².) ~ fdung + fyear + fblock, family=Gamma(link="identity"))
Espero que el tercer modelo a ser la más simplista y desea confirmar esto por un criterio de información. Sin embargo, cuando se mira en AIC y BIC puedo obtener este resultado.
AIC(res1,res2,res3) BIC(result1,res2,res3)
df AIC df BIC
res1 49 5271.617 res1 49 5465.198
res2 16 5334.234 res2 16 5397.44
res3 10 5331.253 res3 10 5370.760
De la AIC, la más compleja del modelo es "mejor" y el BIC el uno con el menor número de df es la mejor. Estoy pensando que con respecto a mi objetivo (identificar los efectos en la biomasa) yo debo confiar en BIC.
Estoy mal aquí con mi conclusión?
Ya lo he intentado modelos de efectos mixtos con el fblock como factor aleatorio, pero entonces el modelo con la distribución Gamma no funciona más y también no podía usar fblock como efecto fijo (que conduce a la NAs para fblock), pero esto no es parte de mi pregunta.