14 votos

Cómo formular el desplazamiento de un GLM

Estoy tratando de construir un modelo lineal generalizado en R para algunos datos de recuento. Básicamente me han contado el número de animales por unidad después de haber ellos se presentó con un tratamiento (para todas las unidades, no fue un 6 de semana de la exposición). Es decir, dependiendo del tratamiento no podría ser más, menos o el mismo número de animales después del tratamiento. Debido a que las unidades tienen diferentes números de animales para empezar, que se podría utilizar una proporción, o la cuenta después de que el tratamiento con el número inicial de los animales como un desplazamiento. He oído la última opción es favorable.

He visto que para que un modelo de Poisson se añade el desplazamiento como esto: offset(log(initial_no)). Sin embargo, me inclino hacia el uso de un modelo binomial negativo. Sería uno, a continuación, establezca la función de enlace de que en frente de la compensación? También he visto a offset(1|initial_no). Cuando es este término se utiliza?

15voto

Ben Bolker Puntos 8729

No sé de donde has escuchado que un Poisson o binomial negativa con un desplazamiento es preferible a un modelo binomial para un número de personas que sobreviven de un número inicial; yo normalmente prefiero un binomio como está más cerca de la real proceso estocástico pensamos que está pasando. Tenga en cuenta que el modelo binomial sería un binomio GLM,

$$ n_{\textrm{surv}} \sim \textrm{Binomio}(p,N) $$ — diferentes de calcular la proporción n/N y el uso de un modelo lineal (o algo así).

Sin embargo, dado que (la versión editada) de la pregunta permite que haya más personas al final que al comienzo del período, el binomio modelos (y variantes como el cuasi - o betabinomial) no funciona, como no permitir un incremento en los números.

En un caso típico (no el tuyo), donde las personas sólo puede ser perdido y no ganó, la de Poisson o binomial negativa modelos sólo dar respuestas sensatas si la proporción de sobrevivir (o la proporción de morir, si usted cuantificar la mortalidad en lugar de la supervivencia) es mucho menor que 1. En general, la variación en el número de supervivientes se convierte en pequeña como la probabilidad de supervivencia de los enfoques 1; el modelo binomial de captura de este fenómeno natural, la distribución de Poisson / NB modelos no. (La varianza se hace pequeño en ambos modelos, ya que la probabilidad se aproxima a 0.)

Si usted desea utilizar un desplazamiento de conteo de modelo en su lugar, el método para la incorporación de la compensación no difieren entre Poisson y NB modelos, ambos de los cuales casi siempre uso un registro de enlace. Es decir, el modelo debería ser escrita como: $$ \begin{split} n_{\textrm{surv}} & \sim \textrm{Poisson}(\mu) \quad \textrm{or} \quad \sim \textrm{NegBinom}(\mu,k) \\ \mu & = \exp(\beta + \log(N)) = N \exp(\beta) \end{split} $$ la segunda línea también se podría haber escrito como $\log(\mu) = \beta + \log(N)$ (que se parece a la fórmula de regresión que contiene un desplazamiento) o $\mu/N = \exp(\beta)$, lo que muestra que usted está modelado $\beta$ como el logaritmo de la proporción de supervivencia. En el caso de que el número puede aumentar, $\beta$ sería positiva y representaría el registro de la espera aumento proporcional en los números.

Si usted pasó a decidir sobre una identidad enlace en su lugar (que yo normalmente no se recomiendan, ya que es fácil en ese caso para el proceso de optimización para intentar valores negativos para la distribución de Poisson/NB decir, que se podría romper el cómputo), entonces usted tendría que utilizar un desplazamiento de $N$ ( $\log(N)$ ) por lo que el $\mu = \beta + N$, lo $\beta$ representa el aditivo para cambiar los números. Mientras que a veces computacionalmente difícil, esto hace conceptuales sentido ...

Una posible ventaja de la NB modelo sería el que cuentas para sobredispersión (por ejemplo, entre la variación individual en la probabilidad de supervivencia), que la binomial o de Poisson modelos no. Usted podría manejar que en el binomio mundo por el cambio a un beta-binomial o de un cuasi-modelo binomial ...

Si se utiliza R, suponiendo que las variables son n (sobrevivir), N (número inicial), ttt (un factor/variable categórica especificando grupo de tratamiento), se utilizaría

  • glm(n/N~ttt, family=binomial, weights=N) o
  • glm(n/N~ttt, family=quasibinomial, weights=N) o
  • glm(n~ttt+offset(log(N)), family=poisson) o
  • MASS::glm.nb(n~ttt+offset(log(N)))

Nunca he visto un modelo con offset(1|initial_no) ; ¿qué software se utiliza este ... ?

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X