Esta cuestión está relacionada con la elección de función de enlace para su modelo lineal generalizado. McCullagh y Nelder decir (página 31):
La función de enlace relaciona el predictor lineal $\eta$ al valor esperado $\mu$ de un dato [valor de resultado] $y$ .
La función de enlace es lo que hace que esto sea un generalizado modelo lineal. Oculto en su llamada a glmer.nb()
es la elección por defecto de un enlace de registro función. Es decir, estás (quizás sin saberlo) modelando la registro del valor esperado de feeding
con el predictor lineal. De forma equivalente, el valor esperado de feeding
se encuentra por exponenciando el predictor lineal.
En la forma en que has escrito tu modelo, la parte de efecto fijo* del predictor lineal sería: $\beta_0$ + $\beta_1$ inf_cat
+ total_inf_cat
. Aquí, $\beta_0$ es la intercepción, $\beta_1$ es el coeficiente de regresión para inf_cat
y el desplazamiento restringe el coeficiente de total_inf_cat
sea exactamente 1. Así que, tal y como has escrito el modelo, cada aumento de 1 unidad de total_inf_cat
le daría una $e$ -aumentar el número de veces de feeding
.
¿Tiene sentido en términos de su comprensión del tema? Probablemente no, si piensa que total_inf_cat
es la duración total disponible y que la cantidad de feeding
debe ser directamente proporcional a total_inf_cat
En igualdad de condiciones. Entonces, el enlace de registro debe ir acompañado de un desplazamiento de log(total_inf_cat)
para mantener esa proporcionalidad directa.
Existen otras opciones de funciones de enlace para los modelos binomiales negativos, con una raíz cuadrada y un enlace de identidad también disponibles para glmer.nb()
. Como dice Demetri Pananos en otra respuesta, si se elige una función de enlace diferente habría que elegir un desplazamiento diferente para mantener la proporcionalidad entre feeding
y total_inf_cat
. Por ejemplo, su modelo con el desplazamiento de total_inf_cat
tendría sentido si especificara el enlace de identidad en su llamada a glmer.nb()
. Esta página y sus enlaces discuten las opciones. Con los datos de recuento, el enlace de registro suele ser el que más sentido tiene.
Por último, los modelos binomiales negativos son más útiles con datos de recuento que tienen más varianza de la que se esperaría de un modelo de Poisson, donde la varianza es necesariamente igual a la media. Si feeding
es una variable continua (cantidad de tiempo dedicado a la alimentación) en su lugar, podría ser mejor un tipo de modelo diferente. Pero con un modelo lineal generalizado de cualquier tipo, se mantiene el mismo principio de elegir un desplazamiento para dar el comportamiento deseado combinado con la función de enlace.
*Supongo que female
representa un conjunto de identificaciones de las madres. A continuación, el (1|female)
La parte de efectos aleatorios del modelo permite que diferentes individuos tengan diferentes valores de intercepción.