1 votos

Modelo mixto anidado con datos longitudinales y variables con muy pocas observaciones

Estoy haciendo mi primer análisis de datos y me cuesta traducir el diseño del experimento al modelo que quiero ajustar. Tengo un par de preguntas básicas sobre la codificación general del modelo, y una más complicada que me ha dado dolores de cabeza.

Tenemos 6 cantidades del mismo abono añadidas a macetas con la misma tierra. Cada cantidad se añade a 3 macetas. Dentro de cada maceta, hay 2 plantas del mismo tipo. De cada planta, medimos la fotosíntesis, la temperatura y la humedad del suelo una vez al mes durante 6 meses. Las macetas están in situ y se conoce el efecto del tiempo en la fotosíntesis.

how data is labelled

(cantidad de abono) 6 x (macetas) 3 x (plantas) 2 x (tiempo) 6 = 216 observaciones.

> str(photo)
'data.frame':   216 obs. of  9 variables:
 $ quantity: int  169 169 169 169 169 169 76 76 76 76 ...
 $ pot     : Factor w/ 18 levels "a","b","c","d",..: 1 1 2 2 3 3 4 4 5 5 ...
 $ plant   : Factor w/ 36 levels "10e","11f","12f",..: 11 22 30 31 32 33 34 
35 36 1 ...
 $ month   : int  5 5 5 5 5 5 5 5 5 5 ...
 $ co2     : num  0.101 0.0669 0.1075 0.0893 0.0846 ...
 $ tsoil   : num  9 8.75 11.05 9.4 10.65 ...
 $ msoil   : num  16.4 18.8 14.4 7.8 15.3 ...

¿Puedo considerar que la planta está anidada en la maceta y la maceta está anidada en la cantidad de fertilizante, con el modelo siguiente?

full<-lmer(co2~quantity+factor(month)+tsoil+msoil+(quantity|pot/plant), data=photo, REML=FALSE)

Si es así, para evitar la pseudoreplicación, ¿debo considerar las plantas como submuestras y promediar sus valores por maceta?

full2<-lmer(co2~quantity+factor(month)+tsoil+msoil+(1|quantity/pot), data=photo, REML=FALSE)

Si no me interesa el tiempo, ¿está bien considerarlo como un efecto aleatorio? Una pendiente aleatoria proviene de la relación entre Y y X que interactúa con los meses.

full3<-lmer(co2~quantity+tsoil+msoil+(1|quantity/pot)+(1+quantity|month), data=photo, REML=FALSE)

Ahora una parte un poco más complicada. Hay otras variables de interés, que espero que expliquen la respuesta, que se midieron del suelo después del experimento (después de 6 meses). Por lo tanto, estas variables contienen 18 observaciones (1 por maceta) ya que el tiempo y la planta no se tienen en cuenta. ¿Puedo soñar con añadirlas al modelo? Una idea de momento es añadir las variables al modelo en función de su relación con los interceptos de las macetas (n=18) de uno de esos modelos anteriores. No he encontrado ninguna información al respecto, así que agradecería comentarios y sugerencias.

0voto

rajakvk Puntos 1965

Primera pregunta:

Puede consultar el ICC para determinar si los niveles anidados adicionales ayudan a su análisis. Por ejemplo, si la varianza del error en el nivel 1 es 0,2 y la varianza del error en el nivel 2 es 0,3, entonces el ICC es 0,3/(,2+,3)=0,6, lo que significa que el nivel 2 es muy importante. Esto es en mi campo y usted puede determinar un CCI significativo basado en la literatura de su campo. También puede hacer un CCI para otros niveles, para determinar si esos niveles ayudan a explicar más. Un modelo de cuatro niveles, plantas en macetas en abono en el tiempo puede no lograr un equilibrio entre parsimonia e información.

Segunda cuestión: se podría considerar que son submuestras, pero eso puede complicar las cosas de tal manera que haya una falta de equilibrio entre la parsimonia y la información.

Tercera pregunta: si no te interesa el tiempo, no lo incluirías en absoluto en el modelo. Incluirlo como efecto aleatorio significa que tiene un efecto.

Cuarta pregunta: podría incluirlos como efectos fijos a nivel de bote.

Nota final 1: si hace su modelo longitudinal, asegúrese de la autocorrelación incluyendo un predictor autorregresivo o restringiendo la matriz de error para que siga un proceso AR(1).

Nota final 2: Como alternativa a un modelo longitudinal clásico, considere un modelo multinivel dinámico (Hamaker y Wichers, 2017), de manera que las estimaciones de los parámetros en el momento 1 sean predictores de una variable de resultado futura. Por ejemplo, tal vez una mayor tsoil estimación del parámetro en el momento 1 está correlacionada con una mayor co2 en el momento 2.

EDITAR

Una fuente popular en mi campo en Raudenbush y Bryk (2002). Otras son OConnel y McCoach (2008), Hox (2010) y Snijders y Bosker (2012). En el texto de Raudenbush y Bryk, el procedimiento al que me refiero en el número 4 se encuentra en el capítulo 8 de la segunda edición.

Yo diría que hacer el ICC a mano para todos los niveles será más fácil porque extraer los valores de las funciones no siempre es sencillo en R . El capítulo 8 del texto de Raudenbush y Bryk también incluye la realización de ICC para niveles adicionales.

La decisión de incluir otro nivel puede hacerse con el CCI, pero también con la explicación de la varianza proporcional (Raudenbush y Bryk, 2002, p. 75 y 79), la prueba de diferencias chi-cuadrado, la prueba de razón de verosimilitud, el AIC, el BIC y otros (McCoach nad Black, 2008). Esta es realmente la belleza del HLM porque se pueden establecer muchos modelos alternativos y ver cuál se ajusta mejor a los datos. Por supuesto, hay un número infinito de modelos alternativos, así que asegúrese de probar los que se basan en la teoría.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X