6 votos

Dinámica de población para el modelo año a año

Mi tarea es evaluar cómo las distintas variables ambientales afectan anual de la población de las fluctuaciones. Para esto, me gustaría utilizar un modelo como: $$ \mbox{log} ( \mu_{i,j+1} ) = \mbox{log} ( \mu_{i,j} ) + R_{j} + \sum\limits_{k} \alpha_k x_{k,j} \\ N_{i,j} \sim \mbox{Poiss} ( \mu_{i,j} ) $$ Donde $N_{i,j}$ es el número de individuos observados en el sitio i en el año j, $\mu_{i,j}$ es el número esperado de individuos en el sitio i en el año j, $x_{k,j}$ a través de todos los $k$ es el vector de las variables ambientales en el año $j$, $\alpha_k$ son los coeficientes y $R_{j}$ es el modelo de coeficiente destinado a manejar "a fondo" el crecimiento de la población (que no se mide, esto es sólo un modelo de coeficiente). Sin embargo creo que voy a quitar el año índice $j$ y usarlo como interceptar solo, para que no se oculte global posible efecto de las variables ambientales.

Esta fue la versión más simple del modelo - en la siguiente etapa, me gustaría manejar sobredispersión (no sé cómo todavía) y tal vez agregar alguna por sitio de efectos aleatorios.

Preguntas:

  1. ¿Cómo puedo ajustan a este modelo en R? Puedo escribir el modelo en WinBUGS, pero prefiere tener "frecuentista" solución en R, porque es mucho más rápido y la inferencia es más fácil (uno tiene los valores de p, t-test, pruebas de F...). Pero que la función o el paquete de uso para adaptarse a ella? No creo que este puede ser implementado mediante GLM! Me percaté de que mi ecuación puede ser convertido a:

    $$ \log\left({\mu_{i,j+1} \\mu_{i,j}}\right) = R_{j} + \sum\limits_{k} \alpha_k x_k$$ Que se asemeja a la regresión logística: $$\log\left({\mu_{i,j+1} \over \mu_{i,j}}\right) = \text{logit}\left({\mu_{i,j+1} \over { \mu_{i,j}} + \mu_{i,j+1}}\right) = R_{j} + \sum\limits_{k} \alpha_k x_k$$ $$N_{i,j+1} \sim \text{Binom}\left(N_{i,j} + N_{i,j+1}, p = {\mu_{i,j+1} \over { \mu_{i,j}} + \mu_{i,j+1}}\right)$$ Sin embargo, no estoy seguro de esto da resultado equivalente; esto convierte a la distribución de Poisson cuenta a la Binomial, y, posiblemente, no sería bastante sencillo de manejar la sobredispersión (la de Poisson sobredispersión para el animal cuenta está bien cubierto y publicado; no está claro cómo es trabajar en el binomio de la versión). Por esta razón, prefiero a calcular el modelo original como es (Poisson).

  2. Cómo incorporar un negativo dependencia de la densidad (es decir, el crecimiento de la población es inferior donde hay una gran cantidad de personas)? Agregar algo como $\beta * \ln(\mu_{i,j})$ a la derecha? Parece poco extraño para mí...

0voto

alexs77 Puntos 36

El crecimiento de la población de los modelos a menudo el uso de Poisson marco de modelado. En R, el ajuste de una distribución de Poisson GLM es fácil. Ver ?glm. Un ejemplo es:

f <- glm(N ~ x + R, family=poisson)

Para estimar: $\log(\mu | x) = \beta_0 + \beta_1 x + \beta_2 R$. $\beta_1$ se interpreta como una relación de la tasa de la comparación de la tasa (o de Poisson lambda) por $N$ diferentes de 1 unidad en $x$. Esto puede ser deseable cuando se $x$ es una condición experimental para el control de los valores, o completamente incondicional. Estoy de acuerdo no sugieren que para mí un buen modelo para $x$ del tiempo, debido a inferir que el año anterior, la población de la actual es muy diferente a la de inferir el próximo año la población de la última. Vamos a celebrar a la pregunta de si un efecto fijo es adecuado para el modelado de la línea de base de las tendencias en el tiempo.

Intuitivamente, tenemos alguna noción de que existe correlación en estos datos, ya que el crecimiento de la población es exponencial. En los cangrejos de herradura, por ejemplo, una mayor cantidad de población significa más mezcla y mayores tasas de fertilidad (ver Agresti Análisis de Datos Categóricos 2ª ed). Esto motiva el uso de un quasilikelihood, o quasipoisson modelo para dar cuenta de sobredispersión si nuestro interés se centra específicamente en la medición de las tasas relativas de algunos de exposición contable para el tiempo.

Sin embargo, ninguno de estos enfoques realmente responder a la pregunta que está realmente interesado en: "¿Cuál es la tasa relativa de $N$ la comparación de los valores de $x$ diferentes por 1 unidad para un estándar de la población?". Es decir, por cada mil temas, digamos, si nos atenemos a $x$ teniendo un valor diferente, ¿cómo que afectan las tendencias de la temporada? La forma de tener en cuenta este es el uso de un desplazamiento.

Las compensaciones son limitados parámetros en el modelo, que puede dar cuenta de los efectos retardados en el tiempo y estandarizar un denominador de crecimiento. Por ejemplo, considere el siguiente modelo lineal:

$\log \left( N_{i} / N_{i-1} \right) = \beta_0 + \beta_1 x$

$N_{i-1}$ (el año anterior las tasas) se considera fijo y conocido. Sin embargo, si $x$ se correlaciona con $N_{i-1}$, el ajuste para el retrasado efecto en el modelo lineal va a conducir a estimaciones sesgadas de $\beta_1$. Así que reescribir el modelo como:

$\log N_{i} = \beta_0 + \beta_1 x + 1 \cdot \log N_{i-1}$.

Esto nos permite dar cuenta del año anterior volumen, mientras que la estimación de la asociación entre el $x$ y el actual años de crecimiento incremental.

0voto

Iwasakabukiman Puntos 518

Baker 2012 (Journal of Applied Ecology) utiliza el modelo similar. Yo le preguntaba y él contestó que él utiliza normal glm()! Él me inspiró a usar la siguiente transformación (que de hecho se utiliza en el artículo enlazado), de la misma forma recursiva sustituto de la $\mbox{log} (\mu_{i,j})$, hasta llegar a esto:

$$\mbox{log} ( \mu_{i,j+1} ) = \mbox{log} ( \mu_{i,1} ) + \sum\limits_{t=1}^{j} R_{t} + \sum\limits_{k} \alpha_k \sum\limits_{t=1}^{j}x_{k,t}$$

and then, $\mbox{log}(\mu_{i,1})$ can be simply taken as a site-specific intercept:

$$\begin{eqnarray} \mbox{log} ( \mu_{i,j+1} ) &=& \alpha_i + \sum\limits_{t=1}^{j} R_{t} + \sum\limits_{k} \alpha_k \sum\limits_{t=1}^{j}x_{k,t} \\ \mbox{log} ( \mu_{i,1} ) &=& \alpha_i \end{eqnarray}$$

así que esto puede ser fácilmente resuelto por el clásico GLM. Es trivial ver que la transformación de ecuaciones son equivalentes a la del modelo original. Yo no trivial ver que todo el proceso de ajuste, incluyendo errores de poisson también será equivalente, pero esto es probablemente más limitación de mi cerebro que un problema real :).

La transformación del modelo es, por supuesto, muy fácilmente instalados usando glm()! Incluyendo sobredispersión el uso de la quasipoisson de la familia.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X