Supongamos que se ha observado la presencia de una especie vegetal a distinta altitud, temperatura y entorno. He aquí sus datos:
Temperature environment altitude
plant1 18.1 mud 812
plant2 15.3 field 754
plant3 17.4 mud 213
plant4 15.2 forest 678
plant5 16.6 field 1023
etc...
Este tipo quiere saber si la abundancia de plantas (número de plantas) que uno puede encontrar depende de las tres variables. Podría ejecutar un MLG con errores distribuidos de Poisson para las variables environment
variable con estos datos:
Number of plants environment
311 forest
102 mud
71 field
etc...
¿Cómo podría hacer para evaluar el efecto de variables continuas sobre la abundancia de plantas sin tener que cortar la variable en trozos ( Temperature
: [10.1:13], [13.1:16], [16.1:19])? ¿Qué tipo de modelo puede incorporar variables continuas y categoriales para dar sentido a los datos de recuento?
¿Tendría sentido realizar dos pruebas de Kolmogorov-Smirnov sobre Temperature
y altitude
para comprobar si estas variables están uniformemente distribuidas y un GLM de prueba, errores distribuidos poisson para environment
? Pero entonces, ¿qué pasa si tiende a tener más mud
¿en altitud? Necesitaría un modelo con todas las variables.