6 votos

¿Por qué los AIC y BIC Mostrar salidas invertidos?

Yo estoy comparando tres relativamente simple GLMs tener una distribución Gamma con el AIC y BIC. El objetivo es identificar los efectos de los fertilizantes (fdung), el año y el sitio de la biomasa de una determinada especie de pasto. Por tanto, el objetivo no es predecir nuevos valores, sino simplemente para identificar los efectos de los tres factores.

Aquí están los modelos utilizados:

res1 <-  glm((Biomass..g.m².) ~  fdung * fyear * fblock, family=Gamma(link="identity"))
res2 <-  glm((Biomass..g.m².) ~  fdung * fyear + fblock, family=Gamma(link="identity"))
res3 <-  glm((Biomass..g.m².) ~  fdung + fyear + fblock, family=Gamma(link="identity"))

Espero que el tercer modelo a ser la más simplista y desea confirmar esto por un criterio de información. Sin embargo, cuando se mira en AIC y BIC puedo obtener este resultado.

AIC(res1,res2,res3)     BIC(result1,res2,res3)
        df      AIC            df      BIC
res1    49 5271.617     res1   49 5465.198
res2    16 5334.234     res2   16 5397.44
res3    10 5331.253     res3   10 5370.760

De la AIC, la más compleja del modelo es "mejor" y el BIC el uno con el menor número de df es la mejor. Estoy pensando que con respecto a mi objetivo (identificar los efectos en la biomasa) yo debo confiar en BIC.

Estoy mal aquí con mi conclusión?

Ya lo he intentado modelos de efectos mixtos con el fblock como factor aleatorio, pero entonces el modelo con la distribución Gamma no funciona más y también no podía usar fblock como efecto fijo (que conduce a la NAs para fblock), pero esto no es parte de mi pregunta.

11voto

Zizzencs Puntos 1358

AIC y BIC tanto penalizar a los modelos de la complejidad, pero que imponen a diferentes penas.

  • AIC = $2k - 2 \log(L)$ donde $k$ es el número de parámetros y $L$ es la probabilidad.

  • BIC = $k*\log(n) - 2\log(L)$ donde $n$ es el número de sujetos.

Por lo tanto, si $\log(n) > 2$, BIC castiga más severamente; esto es casi siempre el caso, ya $e^2 = 7.3$ y es raro tener menos de 8 temas.

En cuanto a que para usar - no hay debate al respecto; véase, por ejemplo, Burnham y Anderson, 2002 Modelo de Selección y Multimodel Inferencia (un buen libro); también dispone de un artículo sobre la comparación de Métodos Sociológicos de Investigación y

4voto

Ben Bolker Puntos 8729

Mis dos centavos sobre este tema: si usted está realmente la comprobación de hipótesis luego yo no uso de la información de los enfoques teóricos, sino más bien la hipótesis clásica enfoques de pruebas (es decir, yo usaría drop1 a res1 hacer likelihood ratio test). Yo, personalmente, prefiero la AIC a BIC en la ecología, porque creo que su lógica se asemeja más a lo que nosotros pensamos acerca de los sistemas: http://emdbolker.wikidot.com/blog:aic-vs-bic . Pero si me encuentro a mí mismo tratando de elegir el modelo que más se acerque a un "verdadero" modelo con un número de no-cero de los parámetros, me gustaría hipótesis a probar en su lugar.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X