6 votos

Correcta especificación del modelo longitudinal en lme4

Estoy tratando de adaptarse a un multinivel longitudinal modelo y tengo una pregunta acerca de cómo especificar.

Los datos consisten de unos 8k de las observaciones recogidas de alrededor de 3k a los individuos en cuatro puntos de tiempo. Los individuos están insertos en grupos y hay cerca de 200 grupos. Tengo dos tipos diferentes de efectos fijos: (a) de medidas repetidas en la observación (por ejemplo, pred1.obs ), y (b) nivel de grupo de predictores que también cambian con el tiempo (por ejemplo, pred2.grp). Debido a que cada nivel de grupo de efectos fijos es también longitudinal, 800 valores (4x200 que se repiten para cada uno de los miembros del grupo en ese momento), pero sólo hay 200 grupos.

Mi pregunta es ¿cuál sería la correcta especificación de este modelo y por qué? e.g:

1: lmer(resultado ~ + pred1.obs + pred2.grp + (tiempo|id) + (tiempo|grp))

2: lmer(resultado ~ + pred1.obs + pred2.grp + (tiempo|id) + (1|grp:tiempo))

3: lmer(resultado ~ + pred1.obs + pred2.grp + (tiempo|id) + (tiempo|grp) + (1|grp:tiempo))

Por lo tanto, sería lme4 de estimar correctamente el modelo, si yo uso (tiempo|grp) o tengo que usar (1|grp:tiempo) o la combinación?

O algo que no he pensado?

Muchas gracias, George

4voto

pirho Puntos 1387

Usted tiene un gran número de grupos, por lo que especulan que (dependiendo de la configuración) usted puede pensar acerca de grupo como un efecto aleatorio, por lo que su (…|grp) términos son probablemente justificado. También puede ser razonable para asociar los efectos aleatorios con los individuos ((…|id) términos). Sin embargo, usted tiene time como covariable en todos sus modelos, así que supongo que usted está buscando un tiempo lineal efecto. En el mismo tiempo tener la (1|grp:time)) plazo o cualquier tipo de (…|time)) términos en el modelo hace que la interpretación de la covariable difícil.

El (1|…) términos corresponden al azar intercepta, por ejemplo, incluidas (1|grp) que estiman una "media" de los resultados en el tiempo=0 para cada grupo expresa como la desviación de la gran intercepción; (1|id) estimo que un individuo interceptar.

El (time|…) términos corresponden al azar de las laderas de la covariable tiempo, por ejemplo, incluidas (time|grp) que estiman una desviación de la gran pendiente para cada grupo; (time|id) que estiman individuales pendientes. [Edit: por Favor, tenga en cuenta la diferencia entre el (time|id) y (0 + time|id) expresiones, consulte ?lmer]

En su modelo de especificaciones que usted está utilizando al azar intercepta y aleatoria de pistas. Si usted necesita o que usted necesita depende de las relaciones entre las variables de estudio. Si conoce la relación, usted debe especificar el modelo correspondiente. Alternativamente, usted puede caber varios modelos y explicar las diferencias entre los resultados.

3voto

kbrinley Puntos 664

Voy a imaginar un ejemplo concreto, con más contexto, para hacer las cosas fáciles. Suponga que usted mida la puntuación en la prueba de 3k estudiantes de 200 escuelas y se mide cada estudiante en 4 puntos en el tiempo (es decir, en cada trimestre). Usted tiene una covariable en el nivel de estudiante que no variar con el tiempo (como el sexo), que se llama pred1.obs y una covariable por la escuela que varían en el tiempo (es decir el número de reuniones entre profesores y padres hasta ese momento en el tiempo). Si en este ejemplo se asemeja a su estudio, que creo que usted tiene que fijar un nivel tres (modelo a nivel individual, a nivel de grupo y a la vez el nivel de los grupos): i = 1 ... 3000 personas t = 1... 4 periodos g = 1... 200 grupos

El modelo sería:

y_i ~ N(a + b_[groups_g] + b.ind*pred.obs1_i, sigma^2) # 1st level
b_g = N(gamma + gamma_[time] + gamma.g[time_t]*pred2.grp, sigma.b^2) # 2nd level
gamma.g_t = N(0, sigma.gamma^2) # 3rd level

Tenga en cuenta que usted tiene que la pendiente en el segundo nivel (nivel de grupo) variando con el tiempo, lo cual tiene sentido, ya que se espera que el efecto de la escuela sobre el rendimiento de los estudiantes pueden variar con el tiempo, en función de la valu de la covariable en el nivel de las escuelas. No estoy seguro de cómo estimar este con lmer (yo sé cómo estimar un modelo Bayesiano usando WinBugs o Entrecortado, llamándolos por R). En cualquier caso, esta es mi sugerencia.

En lme4, me gustaría probar: En primer lugar, ampliar pred2.grp (covariable en el nivel de grupo que varían en el tiempo) a nivel individual, entonces usted tendría repetead de medidas por parte de los individuos en el grupo y el tiempo de nivel. Entonces:

lmer(outcome ~ pred1.obs + pred2.grp + (1|group))

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X