Loading [MathJax]/extensions/TeX/mathchoice.js

37 votos

Comprobación de los supuestos de los modelos mixtos lmer/lme en R

Realicé un diseño repetido en el que probé a 30 hombres y 30 mujeres en tres tareas diferentes. Quiero entender cómo el comportamiento de los hombres y las mujeres es diferente y cómo depende de la tarea. Utilicé tanto el paquete lmer como el lme4 para investigar esto, sin embargo, estoy atascado al tratar de comprobar los supuestos de cualquiera de los dos métodos. El código que ejecuto es

lm.full <- lmer(behaviour ~ task*sex + (1|ID/task), REML=FALSE, data=dat)
lm.full2 <-lme(behaviour ~ task*sex, random = ~ 1|ID/task, method="ML", data=dat)

Comprobé si la interacción era el mejor modelo comparándolo con el modelo más simple sin la interacción y ejecutando un anova:

lm.base1 <- lmer(behaviour ~ task+sex+(1|ID/task), REML=FALSE, data=dat)
lm.base2 <- lme(behaviour ~ task+sex, random= ~1|ID/task), method="ML", data=dat)
anova(lm.base1, lm.full)
anova(lm.base2, lm.full2)

P1: ¿Es correcto utilizar estos predictores categóricos en un modelo lineal mixto?
P2: ¿He entendido bien que la variable de resultado ("comportamiento") no tiene por qué estar distribuida normalmente (entre sexos/tareas)?
P3: ¿Cómo puedo comprobar la homogeneidad de la varianza? Para un modelo lineal simple utilizo plot(LM$fitted.values,rstandard(LM)) . Es el uso de plot(reside(lm.base1)) ¿Suficiente?
P4: Para comprobar la normalidad, ¿se puede utilizar el siguiente código?

hist((resid(lm.base1) - mean(resid(lm.base1))) / sd(resid(lm.base1)), freq = FALSE); curve(dnorm, add = TRUE)

35voto

Honus Wagner Puntos 155

P1: Sí, como cualquier modelo de regresión.

P2: Al igual que los modelos lineales generales, su variable de resultado no necesita estar distribuida normalmente como una variable univariante. Sin embargo, los modelos LME asumen que los residuos del modelo se distribuyen normalmente. Por lo tanto, una transformación o la adición de pesos al modelo sería una forma de tener en cuenta esto (y comprobarlo con gráficos de diagnóstico, por supuesto).

Q3: plot(myModel.lme)

Q4: qqnorm(myModel.lme, ~ranef(., level=2)) . Este código le permitirá hacer gráficos QQ para cada nivel de los efectos aleatorios. Los modelos LME asumen que no sólo los residuos dentro del clúster se distribuyen normalmente, sino que cada nivel de los efectos aleatorios también lo hace. Varíe el level de 0, 1, a 2 para que pueda comprobar la rata, la tarea y los residuos dentro del sujeto.

EDIT: También debería añadir que aunque se asume la normalidad y que la transformación probablemente ayuda a reducir los problemas con los errores no normales/efectos aleatorios, no está claro que todos los problemas se resuelvan realmente o que no se introduzca un sesgo. Si sus datos requieren una transformación, entonces tenga cuidado con la estimación de los efectos aleatorios. Aquí hay un documento que aborda este .

18voto

Parece que está usted muy equivocado sobre los supuestos que rodean a los modelos multinivel. No hay un supuesto de homogeneidad de la varianza en los datos, sólo que los residuos deben estar distribuidos aproximadamente de forma normal. Y los predictores categóricos se utilizan en la regresión todo el tiempo (la función subyacente en R que ejecuta un ANOVA es el comando de regresión lineal).

Para más detalles sobre el examen de los supuestos, consulte el libro de Pinheiro y Bates (p. 174, sección 4.3.1). Además, si planeas usar lme4 (para lo cual el libro no está escrito) puedes replicar sus gráficos usando plot con un lmer modelo ( ?plot.merMod ).

Para comprobar rápidamente la normalidad sería simplemente qqnorm(resid(myModel)) .

16voto

bubak Puntos 8

En cuanto a la Q2:

Según Pinheiro y Bates libro puede utilizar el siguiente enfoque:

"El lme permiten modelar la heteroscedasticidad de la grupo dentro del error a través de una weights argumento. Este tema se tratará en detalle en § 5.2, pero, por ahora, basta con saber que el varIdent La estructura de la función de varianza permite diferentes varianzas para cada nivel de un factor y puede utilizarse para ajustar el modelo heteroscedástico heteroscedástico [...]"

Pinheiro y Bates, p. 177

Si desea comprobar la igualdad de variantes entre sex puede utilizar este enfoque:

plot( lm.base2, resid(., type = "p") ~ fitted(.) | sex,
  id = 0.05, adj = -0.3 )

Si las desviaciones son diferentes, puede actualizar su modelo de la siguiente manera:

lm.base2u <- update( lm.base2, weights = varIdent(form = ~ 1 | sex) )
summary(lm.base2u)

Además, puede echar un vistazo a la robustlmm que también utiliza un enfoque de ponderación. El paquete de Koller Tesis doctoral sobre este concepto está disponible en acceso abierto ("Robust Estimation of Linear Mixed Models"). El resumen dice:

"Una nueva estimación de la escala, la estimación de la escala adaptativa de diseño, es con el objetivo de proporcionar una base sólida para la posterior pruebas. Lo hace igualando la heteroscedasticidad natural de los residuos y ajustando la ecuación de estimación robusta de la propia escala. Estas correcciones de adaptación del diseño son cruciales en los pequeños muestra, donde el número de observaciones puede ser simplemente five veces el número de parámetros a estimar o menos".



No tengo suficientes puntos para los comentarios. Sin embargo, veo la necesidad de aclarar algún aspecto de la respuesta de @John 's arriba. Pinheiro y Bates afirman en la p. 174

Supuesto 1 - los errores dentro del grupo son independientes e idénticamente distribuidos normalmente, con media cero y varianza σ2, y son independientes de los effectos aleatorios.

Efectivamente, esta afirmación no es clara en cuanto a las varianzas homogéneas y no estoy lo suficientemente metido en la estadística como para conocer todas las matemáticas que hay detrás del concepto de LME. Sin embargo, en la página 175, §4.3.1, la sección que trata de Supuesto 1 escriben:

En esta sección, nos concentramos en los métodos para evaluar la de que los errores dentro del grupo se distribuyen normalmente, son centrados en cero, y tienen varianza constante .

Además, en los siguientes ejemplos " varianzas constantes "son realmente importantes. Por lo tanto, se puede especular si implican varianzas homogéneas cuando escriben " idénticamente normalmente distribuido" en la página 174 sin abordarlo más directamente.

-7voto

pgras Puntos 7202

P1: Sí, ¿por qué no?

P2: Creo que el requisito es que los errores se distribuyan normalmente.

P3: Se puede comprobar con el test de Leven, por ejemplo.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X