Esto puede quedar más claro escribiendo la fórmula del modelo para cada uno de estos tres modelos. Sea $Y_{ij}$ sea la observación para la persona $i$ en el sitio $j$ en cada modelo y definir $A_{ij}, T_{ij}$ de forma análoga para referirse a las variables de su modelo.
glmer(counts ~ A + T, data=data, family="Poisson")
es el modelo
$$ \log \big( E(Y_{ij}) \big) = \beta_0 + \beta_1 A_{ij} + \beta_2 T_{ij} $$
que no es más que un modelo ordinario de regresión de Poisson.
glmer(counts ~ (A + T|Site), data=data, family="Poisson")
es el modelo
$$ \log \big( E(Y_{ij}) \big) = \alpha_0 + \eta_{j0} + \eta_{j1} A_{ij} + \eta_{j2} T_{ij} $$
donde $\eta_{j} = (\eta_{j0}, \eta_{j1}, \eta_{j2}) \sim N(0, \Sigma)$ son efectos aleatorios compartidos por cada observación realizada por los individuos del sitio $j$ . Se permite que estos efectos aleatorios estén libremente correlacionados (es decir, no se impone ninguna restricción sobre $\Sigma$ ) en el modelo especificado. Para imponer la independencia, debe colocarlos dentro de paréntesis diferentes, por ejemplo (A-1|Site) + (T-1|Site) + (1|Site)
lo haría. Este modelo supone que $\log \big( E(Y_{ij}) \big)$ es $\alpha_0$ para todos los sitios, pero cada sitio tiene un desplazamiento aleatorio ( $\eta_{j0}$ ) y tiene una relación lineal aleatoria tanto con $A_{ij}, T_{ij}$ .
glmer(counts ~ A + T + (T|Site), data=data, family="Poisson")
es el modelo
$$ \log \big( E(Y_{ij}) \big) = (\theta_0 + \gamma_{j0}) + \theta_1 A_{ij} + (\theta_2 + \gamma_{j1}) T_{ij} $$
Así que ahora $\log \big( E(Y_{ij}) \big)$ tiene alguna relación "media" con $A_{ij}, T_{ij}$ dados por los efectos fijos $\theta_0, \theta_1, \theta_2$ pero esa relación es diferente para cada sitio y esas diferencias son capturadas por los efectos aleatorios, $\gamma_{j0}, \gamma_{j1}, \gamma_{j2}$ . Es decir, la línea de base se desplaza aleatoriamente y las pendientes de las dos variables se desplazan aleatoriamente y todas las personas del mismo sitio comparten el mismo desplazamiento aleatorio.
¿qué es T? ¿Es un efecto aleatorio? ¿Un efecto fijo? ¿Qué se consigue realmente poniendo T en ambos lugares?
$T$ es una de sus covariables. No es un efecto aleatorio - Site
es un efecto aleatorio. Hay un efecto fijo de $T$ que es diferente en función del efecto aleatorio conferido por Site
- $\gamma_{j1}$ en el modelo anterior. Lo que se consigue incluyendo este efecto aleatorio es tener en cuenta la heterogeneidad entre lugares en la relación entre $T$ y $\log \big( E(Y_{ij}) \big)$ .
¿Cuándo debe aparecer algo sólo en la sección de efectos aleatorios de la fórmula del modelo?
Es una cuestión de lo que tiene sentido en el contexto de la aplicación.
En cuanto al intercepto, debe mantener el intercepto fijo por muchas razones (véase, por ejemplo, aquí ); re: el intercepto aleatorio, $\gamma_{j0}$ Esto sirve principalmente para inducir la correlación entre las observaciones realizadas en el mismo lugar. Si no tiene sentido que exista tal correlación, entonces debe excluirse el efecto aleatorio.
En cuanto a las pendientes aleatorias, un modelo con sólo pendientes aleatorias y sin pendientes fijas refleja la creencia de que, para cada sitio, existe alguna relación entre $\log \big( E(Y_{ij}) \big)$ y sus covariables para cada sitio, pero si usted promedia esos efectos sobre todos los sitios, entonces no hay relación. Por ejemplo, si tuviéramos una pendiente aleatoria en $T$ pero sin pendiente fija, esto sería como decir que el tiempo, por término medio, no tiene ningún efecto (por ejemplo, no hay tendencias seculares en los datos) pero cada Site
se dirige en una dirección aleatoria en el tiempo, lo que podría tener sentido. De nuevo, depende de la aplicación.
Tenga en cuenta que puede ajustar el modelo con y sin efectos aleatorios para ver si esto está ocurriendo - no debería ver ningún efecto en el modelo fijo pero sí efectos aleatorios significativos en el modelo posterior. Debo advertirle de que este tipo de decisiones suelen tomarse mejor basándose en la comprensión de la aplicación que en la selección del modelo.