9 votos

Resolver heterocedasticidad en Poisson GLMM

Tengo a largo plazo de recogida de datos, y me gustaría probar, si el número de animales recogidos es influenciado por los efectos de la meteorología. Mi modelo tiene el siguiente aspecto:

glmer(SumOfCatch ~ I(pc.act.1^2) +I(pc.act.2^2) + I(pc.may.1^2) + I(pc.may.2^2) + 
                   SampSize + as.factor(samp.prog) + (1|year/month), 
      control=glmerControl(optimizer="bobyqa", optCtrl=list(maxfun=1e9,npt=5)), 
      family="poisson", data=a2)

Explicación de las variables utilizadas:

  • SumOfCatch: número de animales recogidos
  • pc.ley.1, pc.ley.2: ejes de un componente principal que representa las condiciones climáticas durante el muestreo
  • pc.mayo.1, pc.mayo.2: ejes de una PC que representa las condiciones climáticas en Mayo
  • SampSize: número de trampas pitfall, o la recolección de los transectos de longitudes estándar
  • samp.prog: método de muestreo
  • año: año de muestreo (de 1993 a 2002)
  • mes: mes de muestreo (de Agosto a Noviembre)

El modelo ajustado de los residuos muestran una considerable falta de homogeneidad (heterocedasticidad?) cuando se trazan contra los valores ajustados (ver Fig.1):

Residuals vs. Fitted values - Main model

Mi pregunta principal es: ¿esto es un problema para hacer la fiabilidad de mi modelo cuestionable? Si es así, ¿qué puedo hacer para resolverlo?

Hasta ahora he probado los siguientes:

  • control de sobredispersión mediante la definición de observación a nivel de efectos aleatorios, es decir, el uso de un IDENTIFICADOR único para cada observación, y la aplicación de esta variable de ID como efecto aleatorio; a pesar de que mis datos muestran una considerable sobredispersión, esto no ayuda como los residuos se hizo aún más feo (ver Fig. 2)

Residuals vs. Fitted values - Model with OD control

  • I modelos ajustados sin efectos aleatorios, con cuasi-Poisson glm glm y.nb; también produjo similares residual vs parcelas equipadas para el modelo original

Por lo que yo sé, puede que haya formas para la estimación de heterocedasticidad consistente en el estándar de los errores, pero no he logrado encontrar ningún ejemplo de método de Poisson (o de cualquier otro tipo) GLMMs en R.


En respuesta a @FlorianHartig: el número de observaciones en mi conjunto de datos es N=554, creo que esta es una feria de obs. número de modelo, pero, por supuesto, cuantos más, mejor. He puesto dos cifras, la primera de las cuales es el DHARMa residual a escala de parcela (sugerido por Florian) del modelo principal.

enter image description here

La segunda figura es la de un segundo modelo, en el que la única diferencia es que contiene la observación a nivel de efectos aleatorios (el primero no).

enter image description here

ACTUALIZACIÓN

La figura de la relación entre un clima variable (como predictor, es decir, el eje x) y el muestreo de éxito (respuesta):

Weather-PC and sampling success

ACTUALIZACIÓN II.

Cifras que muestran los valores predictores vs residuales:

Predictors vs. Residuals

10voto

chahedous Puntos 43

Es difícil evaluar el ajuste de la distribución de Poisson (o cualquier otro valor entero GLM para el caso) con Pearson o la desviación de los residuos, debido a que además de un perfecto ajuste de Poisson GLMM se presentan no homogénea de la desviación de los residuos.

Esto es especialmente así que si usted GLMMs con la observación a nivel de REs, debido a la dispersión creado por OL-REs no es considerada por la prueba de Pearson de los residuos.

Para demostrar el problema, el siguiente código crea overdispersed de Poisson de datos, que a continuación se equipa con un modelo perfecto. La prueba de Pearson de los residuos de parecerse mucho a su parcela - por lo tanto, puede ser que no hay ningún problema en absoluto.

Este problema es resuelto por el DHARMa paquete de R, que simula desde el modelo ajustado para transformar los residuos de cualquier GL(M)en un espacio estandarizado. Una vez hecho esto, usted puede evaluar visualmente / prueba residual de los problemas, tales como desviaciones de la distribución residual, la dependencia de un predictor, heterocedasticidad o autocorrelación en la forma normal. Ver el paquete de viñeta para trabajado-a través de ejemplos. Se puede ver en la parte inferior de la parcela que el mismo modelo ahora se ve bien, como debe ser.

Si aún se puede ver heterocedasticidad después de trazar con el DHARMa, usted tendrá que modelo de dispersión como una función de algo, que no es un gran problema, pero es probable que requieren mover a Entrecortado o de otro Bayesiano de software.

library(DHARMa)
library(lme4)

testData = createData(sampleSize = 200, overdispersion = 1, randomEffectVariance = 1, family = poisson())

fittedModel <- glmer(observedResponse ~ Environment1 + (1|group) + (1|ID), family = "poisson", data = testData, control=glmerControl(optCtrl=list(maxfun=20000) ))

# standard Pearson residuals
plot(fittedModel, resid(., type = "pearson") ~ fitted(.) , abline = 0)

# DHARMa residuals
plot(simulateResiduals(fittedModel))

enter image description here

enter image description here

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X