¿Qué significa que dos efectos aleatorios estén muy o perfectamente correlacionados?
Es decir, en R cuando se llama a summary en un objeto de modelo mixto, en "Efectos aleatorios" "corr" es 1 o -1.
summary(model.lmer)
Random effects:
Groups Name Variance Std.Dev. Corr
popu (Intercept) 2.5714e-01 0.5070912
amdclipped 4.2505e-04 0.0206167 1.000
nutrientHigh 7.5078e-02 0.2740042 1.000 1.000
amdclipped:nutrientHigh 6.5322e-06 0.0025558 -1.000 -1.000 -1.000
Sé que esto es malo e indica que la parte de efectos aleatorios del modelo es demasiado compleja, pero estoy tratando de entender
- 1)lo que está haciendo en las estadísticas
- 2) lo que ocurre en la práctica con la estructura de las variables de respuesta.
Ejemplo
Este es un ejemplo basado en " GLMMs en acción: interacción gen-ambiente en la producción total de frutos de poblaciones silvestres de Arabidopsis thaliana " por Bolker et al
Descargar datos
download.file(url = "http://glmm.wdfiles.com/local--files/trondheim/Banta_TotalFruits.csv", destfile = "Banta_TotalFruits.csv")
dat.tf <- read.csv("Banta_TotalFruits.csv", header = TRUE)
Factores de configuración
dat.tf <- transform(dat.tf,X=factor(X),gen=factor(gen),rack=factor(rack),amd=factor(amd,levels=c("unclipped","clipped")),nutrient=factor(nutrient,label=c("Low","High")))
Modelización del log(total.frutos+1) con la "población" (popu) como efecto aleatorio
model.lmer <- lmer(log(total.fruits+1) ~ nutrient*amd + (amd*nutrient|popu), data= dat.tf)
El acceso a la matriz de correlación de los efectos aleatorios muestra que todo está perfectamente correlacionado
attr(VarCorr(model.lmer)$popu,"correlation")
(Intercept) amdclipped nutrientHigh amdclipped:nutrientHigh
(Intercept) 1 1 1 -1
amdclipped 1 1 1 -1
nutrientHigh 1 1 1 -1
amdclipped:nutrientHigh -1 -1 -1 1
Entiendo que son los coeficientes de correlación de dos vectores de coeficientes de efectos aleatorios, como
cor(ranef(model.lmer)$popu$amdclipped, ranef(model.lmer)$popu$nutrientHigh)
¿Significa una alta correlación que los dos efectos aleatorios contienen información redundante? ¿Es esto análogo a la multicolinealidad en la regresión múltiple, cuando un modelo con predictores altamente correlacionados debe ser simplificado?