Estoy analizando los datos de 3 experimentos de campo (granjas=3) para los cítricos de la flor de la enfermedad: la variable de respuesta es binomial porque la flor sólo puede estar enfermo o sano.
Tengo particular interés en la comparación de 5 fungicida equipos de pulverización (trt=5). No, no estoy interesado en el efecto de una granja específica, simplemente representan el total de fincas de la región donde quiero sugerir los mejores tratamientos.
Cada granja tiene 4 bloques (bk=4), incluyendo 2 de los árboles como submuestras (árbol=2) en la que evaluó 100 flores cada uno.
Este es un vistazo rápido de los datos:
dinc <- within(dinc, { tree_id <- as.factor(interaction(farm, trt, bk, tree)) })
farm trt bk tree dis tot tree_id
<fctr> <fctr> <fctr> <fctr><int> <int> <fctr>
iaras Calendar 1 1 0 100 iaras.Calendar.1.1
iaras Calendar 1 2 1 100 iaras.Calendar.1.2
iaras Calendar 2 1 1 100 iaras.Calendar.2.1
iaras Calendar 2 2 3 100 iaras.Calendar.2.2
El modelo que yo consideraba era:
resp <- with(df, cbind(dis, tot-dis))
m1 = glmer(resp ~ trt + (1|farm/bk) , family = binomial, data=df)
He probado la sobredispersión con el overdisp_fun() de GLMM página
chisq ratio p logp
4.191645e+02 3.742540e+00 4.804126e-37 -8.362617e+01
Como la proporción (residual dev/residual df) > 1, y el valor de p < 0.05, he considerado que añadir la observación de nivel de efectos aleatorios (enlace) para lidiar con la sobredispersión.
así que ahora se añade un efecto aleatorio para cada fila (tree_id
) para el modelo, pero no estoy seguro de cómo incluirlo. Este es mi planteamiento:
m2 = glmer(resp ~ trt + (1|farm/bk) + (1|tree_id), family = binomial, data=df)
También me pregunto si farm
debe ser un efecto fijo, ya que solo tiene 3 niveles de...
m3 = glmer(resp ~ trt * farm + (1|farm:bk) + (1|tree_id), family = binomial, data=df)
Realmente agradezco sus sugerencias acerca de mi modelo de especificaciones...