1 votos

¿Es un parámetro de sobredispersión de 5.17 para GLMM con la familia Beta demasiado alto para obtener resultados confiables?

Estoy ejecutando un modelo mixto lineal generalizado con familia beta sobre el efecto de la cubierta superior (proporción (0,1)) en la proporción de aves que carroñan de carrona dejada en la naturaleza (proporción (0,1)), con Área como factor aleatorio (factor w/ 6 niveles).

> myglmm <- glmmTMB(ProportionBirdsScavenging ~ OverheadCover + (1|Area), data = df_prop_birds_eating, beta_family(link = "logit"), weights = pointWeight_scaled)
> summary(myglmm)
Family: beta  ( logit )
Formula:          ProportionBirdsScavenging ~ OverheadCover + (1 | Area)
Data: df_prop_birds_eating
Weights: pointWeight_scaled

     AIC      BIC   logLik deviance df.resid 
    -5.3      0.8      6.7    -13.3       30 

Random effects:

Conditional model:
 Groups Name        Variance  Std.Dev. 
 Area   (Intercept) 1.198e-10 1.094e-05
Número de observaciones: 34, grupos:  Area, 6

Parámetro de sobredispersión para la familia beta (): 5.17 

Modelo condicional:
              Estimado Error Estándar valor z valor p    
(Intercepto)     1.7869     0.7196   2.483 0.013017 *  
OverheadCover  -4.7387     1.2661  -3.743 0.000182 ***
---
Códigos de significancia:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

El valor del parámetro de sobredispersión es 5.17. He intentado encontrar información sobre este parámetro para modelos beta, pero no pude encontrar mucho. La mayoría de lo que encontré fue sobre la distribución poisson o binomial, y pruebas sobre la significancia ej. DHARMa::testOverdispersion, performance::check_overdispersion, y AER::dispersiontest solo prueban para GLMs de Poisson Mi pregunta es si este valor de parámetro de sobredispersión de 5.17 es demasiado alto? ¿Significa esto que las suposiciones del modelo no se cumplen y la salida no se puede confiar? En caso afirmativo, ¿hay alguna forma de solucionarlo para que mi modelo produzca resultados confiables?

Sobre la sobredispersión en modelos de Poisson, con frecuencia leo que agregar un parámetro de dispersión 'arreglaría' la sobredispersión, pero en el modelo beta que estoy utilizando ya hay un parámetro de dispersión. ¿Alguien puede explicar esto?

4voto

chahedous Puntos 43

Usar la palabra "parámetro de sobredispersión" quizás no sea la opción ideal para los desarrolladores de glmmTMB - "parámetro de dispersión" podría ser más apropiado.

La sobredispersión ocurre cuando la varianza residual es mayor de lo que asume tu modelo ajustado. Principalmente solo ocurre en modelos que tienen una dispersión fija (por ejemplo, Poisson).

Cuando ajustas un modelo con dispersión variable (como haces aquí), tu modelo ajusta la varianza residual esperada (=dispersión) durante el ajuste. El parámetro de dispersión te da retroalimentación sobre este ajuste, pero en relación con esta dispersión ajustada, el modelo no está sobredisperso.

Por lo tanto, una prueba de dispersión para un modelo con un parámetro de dispersión > 1 no debería indicar sobredispersión (al menos asumiendo que los residuos se dispersan con la dispersión estimada). Ver también https://github.com/florianhartig/DHARMa/issues/143. Además, no hay motivo para desconfiar de un modelo con un gran parámetro de dispersión estimado.

Por cierto, DHARMa::testOverdispersion debería funcionar para la familia beta. Acabo de probar esto, y vemos exactamente el comportamiento que describo arriba: la dispersión estimada es alrededor de 4, pero la prueba de dispersión es negativa.

x = runif(100,-1,1)
y = plogis(x + rnorm(100))

library(glmmTMB)
library(DHARMa)

fit <- glmmTMB(y~x, family = beta_family())

summary(fit)
res <-simulateResiduals(fit, plot = T)

enter image description here

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X