9 votos

¿Cómo tratar con trama en forma de s muy qq en un modelo mixto lineal (lme4 1.0.4)?

Tengo un conjunto de datos en la que tengo que medir una variable (diff) en 38 participantes (sub) en dos condiciones diferentes (cond.lag). Ahora me interesa o no, si la pendiente de la position del elemento difiere entre las dos condiciones. Es decir, que yo estoy interesado en saber si hay o no hay una interacción entre cond.lag y position (que me centro en 0 antes).

require(lme4)
options(contrasts=c('contr.sum', 'contr.poly'))

# read data
dat <- read.table("http://pastebin.com/raw.php?i=MmNQigRv", colClasses = c(NA, rep("factor", 2), rep("numeric", 2)))
# center position
dat$pos.centered <- scale(dat$position, scale = FALSE)

# fit the model
m1 <- lmer(diff ~ cond.lag * pos.centered + (cond.lag * pos.centered|sub), dat)
print(summary(m1), corr = FALSE)
## [...]
## Fixed effects:
##                          Estimate Std. Error t value
## (Intercept)             0.0819639  0.0121378   6.753
## cond.lag1              -0.0122033  0.0155427  -0.785
## pos.centered            0.0031775  0.0006429   4.942
## cond.lag1:pos.centered -0.0011495  0.0011351  -1.013

Aunque parece como si no encuentro una interacción (sólo un efecto principal de la pendiente de la posición), estoy seguro de si o no este modelo tiene sentido como me parece una muy inusual (espero pesado de cola) qq plot:

qqnorm(resid(m1))
qqline(resid(m1))

enter image description here

Preguntas:

  • ¿Este modelo tiene ningún sentido, aunque aparentemente el mal se comportó de residuos?
  • ¿Qué puedo hacer para quitar las pesadas colas o para obtener un mejor modelo?

5voto

Ben Bolker Puntos 8729

En caso de duda, mirar los datos en bruto:

library(ggplot2)
theme_set(theme_bw())
ggplot(dat,aes(pos.centered,diff,colour=cond.lag))+geom_point()+
    geom_line(aes(group=sub:cond.lag),alpha=0.4)
ggsave("SE_ex.png",width=6,height=4)

enter image description here

(También se podría tratar de colour=sub y facet_grid(.~cond.lag))

Parece que el problema es la explosión de la varianza para el centrado de la posición >5 o así (más varianza que esperar sólo de divergentes líneas individuales). No estoy muy seguro de qué hacer al respecto: usted puede mirar el individuo curvas un poco más y pensar acerca de si hay una buena (fenomenológicamente o mecánicamente) modelo no lineal de estos datos. Es un poco difícil en el momento de combinar modelos de heterocedasticidad (que lme puede hacer, pero no lmer) con cruzado de efectos aleatorios (posible en lme, pero es más difícil que en lmer) en R, pero podría (??) de ser posible, como por ejemplo en SAS PROC NLMIXED, Genstat/COMO-REML, AD Model Builder ...

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X