Estoy haciendo mi primer análisis de datos y me cuesta traducir el diseño del experimento al modelo que quiero ajustar. Tengo un par de preguntas básicas sobre la codificación general del modelo, y una más complicada que me ha dado dolores de cabeza.
Tenemos 6 cantidades del mismo abono añadidas a macetas con la misma tierra. Cada cantidad se añade a 3 macetas. Dentro de cada maceta, hay 2 plantas del mismo tipo. De cada planta, medimos la fotosíntesis, la temperatura y la humedad del suelo una vez al mes durante 6 meses. Las macetas están in situ y se conoce el efecto del tiempo en la fotosíntesis.
(cantidad de abono) 6 x (macetas) 3 x (plantas) 2 x (tiempo) 6 = 216 observaciones.
> str(photo)
'data.frame': 216 obs. of 9 variables:
$ quantity: int 169 169 169 169 169 169 76 76 76 76 ...
$ pot : Factor w/ 18 levels "a","b","c","d",..: 1 1 2 2 3 3 4 4 5 5 ...
$ plant : Factor w/ 36 levels "10e","11f","12f",..: 11 22 30 31 32 33 34
35 36 1 ...
$ month : int 5 5 5 5 5 5 5 5 5 5 ...
$ co2 : num 0.101 0.0669 0.1075 0.0893 0.0846 ...
$ tsoil : num 9 8.75 11.05 9.4 10.65 ...
$ msoil : num 16.4 18.8 14.4 7.8 15.3 ...
¿Puedo considerar que la planta está anidada en la maceta y la maceta está anidada en la cantidad de fertilizante, con el modelo siguiente?
full<-lmer(co2~quantity+factor(month)+tsoil+msoil+(quantity|pot/plant), data=photo, REML=FALSE)
Si es así, para evitar la pseudoreplicación, ¿debo considerar las plantas como submuestras y promediar sus valores por maceta?
full2<-lmer(co2~quantity+factor(month)+tsoil+msoil+(1|quantity/pot), data=photo, REML=FALSE)
Si no me interesa el tiempo, ¿está bien considerarlo como un efecto aleatorio? Una pendiente aleatoria proviene de la relación entre Y y X que interactúa con los meses.
full3<-lmer(co2~quantity+tsoil+msoil+(1|quantity/pot)+(1+quantity|month), data=photo, REML=FALSE)
Ahora una parte un poco más complicada. Hay otras variables de interés, que espero que expliquen la respuesta, que se midieron del suelo después del experimento (después de 6 meses). Por lo tanto, estas variables contienen 18 observaciones (1 por maceta) ya que el tiempo y la planta no se tienen en cuenta. ¿Puedo soñar con añadirlas al modelo? Una idea de momento es añadir las variables al modelo en función de su relación con los interceptos de las macetas (n=18) de uno de esos modelos anteriores. No he encontrado ninguna información al respecto, así que agradecería comentarios y sugerencias.