5 votos

¿El desplazamiento tiene que ser siempre en escala logarítmica con NB GLMM?

Estoy utilizando un GLMM binomial negativo con el paquete R lme4 para detectar diferencias en el tiempo que las madres pasan alimentándose antes y después del parto (inf_cat).

    inf30.feed <- glmer.nb(feeding ~ (inf_cat) + 
                    offset(total_inf_cat) + (1|female), 
                    data=mother_ownno_inf30)

Mi modelo tiene una compensación de la cantidad total de tiempo de observación del individuo. Todavía soy relativamente nuevo en GLMMs en R y he estado mirando un montón de ejemplos en línea, muchos de los cuales tienen el desplazamiento en una escala logarítmica.

¿El desplazamiento tiene que ser siempre en una escala logarítmica? ¿Por qué? ¿Y cuándo es conveniente hacerlo?

7voto

Alex Puntos 128

Normalmente, se utiliza un desplazamiento cuando estamos modelando algún tipo de dato de tasa (por ejemplo, muertes por 100.000, accidentes por 100.000, etc.).

Esto se modela naturalmente como una especie de ratio, por lo que se tienen datos en forma de $E(y_i)/n_i$

En el GLM, modelamos la expectativa a través de algún tipo de función de enlace, por lo que

$$ g^{-1}(E(y_i)/n_i) = \mathbf{x}^T\beta$$

Con la función de enlace logarítmica, tenemos

$$ \log(E(y_i)) = \mathbf{x}^T\beta + \log(n_i) $$

de la aplicación de las normas de registro. Así que para responder a su pregunta, el desplazamiento es no siempre un registro. Depende de la función de enlace que utilices.

6voto

EdM Puntos 5716

Esta cuestión está relacionada con la elección de función de enlace para su modelo lineal generalizado. McCullagh y Nelder decir (página 31):

La función de enlace relaciona el predictor lineal $\eta$ al valor esperado $\mu$ de un dato [valor de resultado] $y$ .

La función de enlace es lo que hace que esto sea un generalizado modelo lineal. Oculto en su llamada a glmer.nb() es la elección por defecto de un enlace de registro función. Es decir, estás (quizás sin saberlo) modelando la registro del valor esperado de feeding con el predictor lineal. De forma equivalente, el valor esperado de feeding se encuentra por exponenciando el predictor lineal.

En la forma en que has escrito tu modelo, la parte de efecto fijo* del predictor lineal sería: $\beta_0$ + $\beta_1$ inf_cat + total_inf_cat . Aquí, $\beta_0$ es la intercepción, $\beta_1$ es el coeficiente de regresión para inf_cat y el desplazamiento restringe el coeficiente de total_inf_cat sea exactamente 1. Así que, tal y como has escrito el modelo, cada aumento de 1 unidad de total_inf_cat le daría una $e$ -aumentar el número de veces de feeding .

¿Tiene sentido en términos de su comprensión del tema? Probablemente no, si piensa que total_inf_cat es la duración total disponible y que la cantidad de feeding debe ser directamente proporcional a total_inf_cat En igualdad de condiciones. Entonces, el enlace de registro debe ir acompañado de un desplazamiento de log(total_inf_cat) para mantener esa proporcionalidad directa.

Existen otras opciones de funciones de enlace para los modelos binomiales negativos, con una raíz cuadrada y un enlace de identidad también disponibles para glmer.nb() . Como dice Demetri Pananos en otra respuesta, si se elige una función de enlace diferente habría que elegir un desplazamiento diferente para mantener la proporcionalidad entre feeding y total_inf_cat . Por ejemplo, su modelo con el desplazamiento de total_inf_cat tendría sentido si especificara el enlace de identidad en su llamada a glmer.nb() . Esta página y sus enlaces discuten las opciones. Con los datos de recuento, el enlace de registro suele ser el que más sentido tiene.

Por último, los modelos binomiales negativos son más útiles con datos de recuento que tienen más varianza de la que se esperaría de un modelo de Poisson, donde la varianza es necesariamente igual a la media. Si feeding es una variable continua (cantidad de tiempo dedicado a la alimentación) en su lugar, podría ser mejor un tipo de modelo diferente. Pero con un modelo lineal generalizado de cualquier tipo, se mantiene el mismo principio de elegir un desplazamiento para dar el comportamiento deseado combinado con la función de enlace.


*Supongo que female representa un conjunto de identificaciones de las madres. A continuación, el (1|female) La parte de efectos aleatorios del modelo permite que diferentes individuos tengan diferentes valores de intercepción.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X