1 votos

Lme4: Problemas al intentar ejecutar glmer.nb binomial negativo

Este es mi primer post y soy muy nuevo en el mundo de la computación R, así que espero haber preguntado todo en el formato correcto, incluido información suficiente, etc.

Mi conjunto de datos consiste en datos de proporciones para observaciones de comportamiento de escarabajos en un cadáver, por lo tanto, están entre 0 y 1. Quiero probar estos contra mis efectos fijos (Llamada, Población, Ancho del pronoto) así como efectos aleatorios (ID de Macho Focal y Orden de Ratón)

model1 <- glmer(cbind(Total.ON, Not.ON) ~ Call + Population + Pronotum.width.mm  + (1|Focal.Male.ID) 
           + (1|Mouse.Order), family = binomial, data = Beetle.data)

Ajuste de modelo lineal generalizado mixto mediante máxima verosimilitud (Aproximación Laplace) ['glmerMod']
Familia: binomial  ( logit )
Fórmula: cbind(Total.ON, Not.ON) ~ Call + Population + Pronotum.width.mm +      
(1 | Focal.Male.ID) + (1 | Mouse.Order)
Datos: Beetle.data

 AIC      BIC   logLik deviance df.resid 
299.2    329.2   -141.6    283.2      306 

Residuos escalados: 
Min      1Q  Mediana      3Q     Max 
-2.4854 -0.2559 -0.1704  0.4027  1.8366 

Efectos aleatorios:
 Grupos        Nombre        Varianza Desv.Est.
 Focal.Male.ID (Intercepto) 1.67079  1.29259 
 Mouse.Order   (Intercepto) 0.00104  0.03224 
Número de observaciones: 314, grupos:  Focal.Male.ID, 152; Mouse.Order, 2

Efectos fijos:
                Estimado Error estándar valor z Valor P    
(Intercepto)          -5.3314     2.8099  -1.897 0.057779 .  
CallSin competidor     1.4068     0.3818   3.685 0.000229 ***
PoblaciónGlos        0.1858     0.5889   0.316 0.752354    
PoblaciónLab         0.2099     0.6192   0.339 0.734691    
PoblaciónBotellaNueva   0.2181     0.5811   0.375 0.707435    
Ancho del pronoto.mm     0.4534     0.5551   0.817 0.413996    
---
Códigos de significancia: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Correlación de Efectos Fijos:
        (Int) CllN-c PpltnG PpltnL PpltnN
CllN-cmpttr -0.160                            
PoblacnGls -0.155  0.021                     
PoblacinLb -0.276  0.022  0.487              
PpltnNwbttl -0.050  0.012  0.504  0.473       
Prntm.wdth. -0.982  0.053  0.047  0.177 -0.055
Código de convergencia: 0
El modelo no convergió con max|grad| = 1.61379 (tol = 0.001, componente 1)

Después de ejecutar este modelo, probé la sobre-dispersión usando la función overdisp_fun de la página GLMM y obtuve estos ratios

> overdisp_fun(model1)
 chisq      ratio        rdf          p  
87.310363   0.285328 306.000000   1.000000 

Después de esto, pensé en intentar ajustar un modelo binomial negativo a mis datos para ver si esto mejora los ratios de dispersión pero aquí es donde me encuentro con problemas.

He intentado usar glmer.nb en el paquete lme4 pero sigo recibiendo mensajes de error

model1 <- glmer.nb(cbind(Total.ON, Not.ON) ~ Call + Population + Pronotum.width.mm + (1|Focal.Male.ID) 
           + (1|Mouse.Order), data = Beetle.data)

Error in (function (fr, X, reTrms, family, nAGQ = 1L, verbose = 0L, maxit = 100L,  : updateXwts: dimension mismatch

Si alguien tiene ideas o recomendaciones para mi modelo en general, serían muy apreciadas.

Gracias de antemano

6voto

Ben Bolker Puntos 8729

Hay varias cosas sucediendo aquí.

  • No vale la pena preocuparse por ningún aspecto de los diagnósticos o el ajuste del modelo hasta que esté seguro de que ha especificado correctamente su modelo (y en este caso particular su variable de respuesta). Para GLM(M)s binomiales en R, la matriz de respuesta debería ser cbind(num_successes,num_failure). ¿Es su Total.ON el número total de casos medidos para cada observación (es decir, éxitos + fracasos)? Si es así, debería usar cbind(Total.ON-Not.ON,Not.ON) ...

    si (como se menciona en los comentarios) Total.ON es una proporción de éxitos y Not.ON es un número total de observaciones, debería usar o bien cbind(Total.ON*Not.ON,(1-Total.ON)*Not.ON) o (mi preferencia) usar Total.ON como su respuesta e incluir weights=Not.ON como un argumento adicional.

  • los resultados de su prueba de sobredispersión:

    chisq ratio rdf p
    87.310363 0.285328 306.000000 1.000000

en realidad sugieren subdispersión; el ratio es inferior a uno y el valor p es 1.00

  • Es una confusión muy común (y comprensible) pensar que la binomial negativa es una extensión de la distribución binomial que es adecuada para tener en cuenta la sobredispersión. En realidad, la binomial negativa extiende la distribución Poisson. La sección sobre sobredispersión en el FAQ de GLMM sugiere varios métodos para tratar con la sobredispersión en modelos binomiales: efectos aleatorios a nivel de observación (= modelos logit-Normal-binomial), modelos beta-binomiales (por ejemplo, en glmmTMB), cuasi-verosimilitud, ...
  • si termina teniendo subdispersión, puede usar cuasi-verosimilitud (en este momento, no conozco un análogo binomial subdisperso); hay una nueva sección en el FAQ de GLMM sobre subdispersión

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X