En un estudio sobre una especie de ave, observo 558 localizaciones. A cada localización se le asigna uno de 4 casos:
- nunca ocupado por la especie (nunca)
- ocupado en el pasado pero abandonado ahora (pasado)
- ocupados en el pasado y ahora (siempre)
- no ocupado en el pasado, pero ocupado ahora (actual)
Dispongo de un conjunto de variables explicativas (clima y estructura del paisaje). Una versión simplificada de los datos es la siguiente:
>bird.data
location_ID case region temperature forest.coverage
1 current A 7.6 33
2 always A 8.1 65
3 current B 7.4 82
4 never A 9.0 11
5 always C 6.8 22
6 past A 8.1 46
7 past B 7.8 51
8 current C 7.9 52
... ... ... ... ...
En R, quiero comprobar si las variables explicativas tienen un efecto sobre la presencia pasada y actual de las especies de aves. Para empezar, quiero calcular la glmm univariante utilizando el método lme4
-paquete. region
se supone que actúa como un factor aleatorio. De forma similar al anova, espero que esto pueda ayudar a mostrar si los cuatro grupos difieren en sus variables explicativas.
Yo intentaría algo como lmer(case~temperature + forest.coverage + (1|region), data=bird.data)
Sin embargo, no estoy familiarizado con el modelado de variables de respuesta categóricas. ¿Existe alguna regla a seguir? Especialmente: ¿por dónde puedo empezar para determinar una familia útil para mi caso?