23 votos

Comparación de modelos no anidados con AIC

Digamos que tenemos a GLMMs

mod1 <- glmer(y ~ x + A + (1|g), data = dat)
mod2 <- glmer(y ~ x + B + (1|g), data = dat)

Estos modelos no están anidados en el sentido habitual de:

a <- glmer(y ~ x + A + (1|g),     data = dat)
b <- glmer(y ~ x + A + B + (1|g), data = dat)

por lo que no podemos hacer anova(mod1, mod2) como lo haríamos con anova(a ,b) .

¿Podemos utilizar el AIC para decir cuál es el mejor modelo?

32voto

Aston Puntos 131

El AIC puede aplicarse con modelos no anidados. De hecho, éste es uno de los mitos (¿malentendidos?) más extendidos sobre el AIC. Véase:

Una cosa con la que hay que tener cuidado es con la inclusión de todas las constantes de normalización, ya que éstas son diferentes para los distintos modelos (no anidados):

Véase también:

En el contexto de los GLMM, una cuestión más delicada es la fiabilidad del AIC para comparar este tipo de modelos (véase también la de @BenBolker). En el siguiente artículo se discuten y comparan otras versiones del AIC:

13voto

Ben Bolker Puntos 8729

Como referencia, un contraargumento: Brian Ripley afirma en "Seleccionar entre grandes clases de modelos" pp. 6-7

Supuestos cruciales ... Los modelos están anidados (nota: véase la parte inferior de la página 615 en la reimpresión de Akaike (1973)). - El AIC se utiliza ampliamente cuando no son

El pasaje relevante (también p. 204 de otra reimpresión de Akaike), comienza creo con la frase "El problema de la identificación de modelos estadísticos se formula a menudo como el problema de la selección de $f(x|_k\theta$ ) ...") no está del todo disponible aquí Estoy buscando un PDF del documento para poder citar el pasaje aquí...

(Lo he citado a continuación, aunque honestamente en este punto no puedo ver cómo apoya el punto de Ripley - ciertamente discute la derivación en el contexto de los modelos anidados pero ... ???)

Ripley, B. D. 2004. "Selección entre grandes clases de modelos". En Métodos y modelos en estadística editado por N. Adams, M. Crowder, D. J Hand y D. Stephens, 155-70. Londres, Inglaterra: Imperial College Press.

Akaike, H. (1973) La teoría de la información y una extensión de la máxima probabilidad. En Segundo simposio internacional sobre teoría de la información (Eds B. N. Petrov y F. Cáski), pp. 267-281, Budapest. Akademiai Kaidó. Reimpreso en Avances en las estadísticas eds Kotz,S. & Johnson, N. L. (1992), volumen I, pp. 599-624. Nueva York: Springer.

Como referencia, véase también este post en MathOverflow .


longish passage from Akaike et al 1973 pp. 204ff

10voto

Mike Puntos 123

Parece que Akaike pensaba que el AIC era una herramienta útil para comparar modelos no anidados.

"Una observación importante sobre el AIC es que se define sin referencia específica al modelo verdadero [ f(x|k) ]. Así, para cualquier número finito de modelos paramétricos, siempre podemos considerar un modelo ampliado que desempeñará el papel de [ f(x|k) ] Esto sugiere que el AIC puede ser útil, al menos en principio, para la comparación de modelos que no están anidados, es decir, la situación en la que la prueba convencional de razón de verosimilitud logarítmica no es aplicable."

(Akaike 1985, pág. 399)

Akaike, Hirotugu. "Predicción y entropía". Selected Papers of Hirotugu Akaike. Springer, Nueva York, NY, 1985. 387-410.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X