25 votos

Permite la comparación de los modelos de efectos mixtos

He estado mirando de efectos mixtos modelado usando el paquete lme4 en R. estoy usando principalmente la lmer orden, de modo que lo voy a plantear mi pregunta a través de un código que utiliza la sintaxis. Supongo que un general fácil, la pregunta podría ser, ¿está bien para comparar dos modelos construidos en lmer el uso de cocientes de probabilidad basado en idénticos conjuntos de datos? Creo que la respuesta debe ser "no", pero podría ser incorrecta. He leído la información contradictoria sobre si los efectos aleatorios tiene que ser el mismo o no, y qué componente de la de efectos aleatorios, es decir con eso? Así que, voy a presentar un par de ejemplos. Voy a sacarlos de medidas repetidas de los datos de uso de palabra estímulos, tal vez algo como Baayen (2008) sería útil en la interpretación.

Digamos que tengo un modelo en el que hay dos efectos fijos de los predictores, vamos a llamar a, B, y, y algunos de los efectos aleatorios... las palabras y los sujetos que se percibe de ellos. Yo podría construir un modelo como el siguiente.

m <- lmer( y ~ A + B + (1|words) + (1|subjects) )

(tenga en cuenta que he intencionalmente dejado fuera data = y vamos a suponer que siempre me refiero REML = FALSE para mayor claridad)

Ahora, de los siguientes modelos, que están bien para comparar con una prueba de razón de verosimilitud a la de arriba y la que no?

m1 <- lmer( y ~ A + B + (A+B|words) + (1|subjects) )
m2 <- lmer( y ~ A + B + (1|subjects) )              
m3 <- lmer( y ~ A + B + (C|words) + (A+B|subjects) )
m4 <- lmer( y ~ A + B + (1|words) )                 
m5 <- lmer( y ~ A * B + (1|subjects) )   

Reconozco que la interpretación de algunas de estas diferencias pueden ser de difícil o imposible. Pero vamos a poner esto a un lado por un segundo. Sólo quiero saber si hay algo fundamental en los cambios que se opone a la posibilidad de comparar. También quiero saber si, en caso de LR pruebas están bien, AIC comparaciones son así.

17voto

Raptrex Puntos 115

Utilizando máxima verosimilitud, cualquiera de estos puede ser comparado con el AIC; si los efectos fijos son los mismos (m1 a m4), con REML o ML está muy bien, con REML generalmente preferidos, pero si son diferentes, el ML se puede utilizar. Sin embargo, la interpretación es generalmente difícil cuando ambos efectos fijos y de efectos aleatorios están cambiando, por lo que en la práctica, la mayoría de recomendar el cambio de sólo uno o el otro al mismo tiempo.

Mediante la prueba de razón de verosimilitud es posible, pero desordenado debido a la costumbre de chi-cuadrado aproximación no se mantiene cuando se prueba si una de las componentes de varianza es cero. Ver Aniko la respuesta para más detalles. (Felicitaciones a Aniko para leer la pregunta más cuidadosamente de lo que hice y leer mi respuesta original con cuidado lo suficiente como para notar que le falta a este punto. ¡Gracias!)

Pinhiero/Bates es el clásico de referencia; describe la nlme paquete, pero la teoría es la misma. Así, la mayoría de la misma; Doug Bates ha cambiado sus recomendaciones sobre la inferencia desde la escritura de ese libro y las nuevas recomendaciones se reflejan en la lme4 paquete. Pero eso es más de lo que yo quiero entrar en aquí. Más legible referencia Weiss (2005), el Modelado de Datos Longitudinales.

13voto

John with waffle Puntos 3472

Tienes que ser cuidadoso en el uso de la probabilidad de la relación de las pruebas de la hora de evaluar si una de componentes de varianza es 0 (m vs m-m4), debido a la típica de la chi-cuadrado aproximación hace que no se aplican. La razón es que el contraste de hipótesis es $\sigma^2=0$, y está en el límite del espacio de parámetros, por lo que los resultados clásicos no se aplican.

Hay toda una teoría de la distribución de la LRT en estas situaciones (véase, por ejemplo, el Auto y Liang, 1987 [1]), sin embargo rápidamente se convierte en un desorden. Para el caso especial de un solo parámetro de golpear el límite (por ejemplo, m vs m2), el cociente de probabilidad tiene un $\frac 12 \chi^2_1 + \frac 12 \chi^2_0$ de la distribución, que en la práctica significa que usted tiene que reducir a la mitad su valor de p basado en el $\chi^2_1$.

Sin embargo, como @Aaron dijo, muchos expertos no recomiendan hacer una prueba de razón de verosimilitud como este. Las posibles alternativas son los criterios de información (AIC, BIC, etc), o el arranque de la LRT.

[1] Auto, S. G. & Liang, K. propiedades Asintóticas de los estimadores de máxima verosimilitud y probabilidad de la relación de pruebas bajo condiciones no estándar J. Amer. Estatismo. Assoc., 1987, 82, 605-610.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X