Processing math: 100%

11 votos

GLM para datos proporcionales y subdispersión

Me gustaría pedirte ayuda para entender un problema estadístico de mi conjunto de datos. He realizado un MLG con datos proporcionales, utilizando una distribución binomial. Sin embargo, he encontrado subdispersión en mi modelo y no sé cómo lidiar con eso. Soy consciente de que una solución para la sobredispersión es ajustar un modelo utilizando una distribución cuasibinomial, pero no he podido encontrar una solución a mi problema en la literatura.

Estoy comparando las diferencias entre lugares de bosque continuo y fragmentos en cuanto a la proporción de riqueza y abundancia de especies especialistas. Por lo tanto, los modelos son:

M1 <- glm(prop_rich_speci ~ LandscapeBin, 
          family = binomial, 
          weights=rich_total_sp, 
          data = envir.all)
M2 <- glm(prop_abu_speci ~ LandscapeBin,  
          family = binomial, 
          weights=abu_total_sp, 
          data = envir.all)

Creo que utilizando una distribución cuasibinomial puedo resolver mi problema (subdispersión), como sugirió Ben.

2 votos

¿Qué quiere decir con datos proporcionales? ¿Quiere decir que el resultado es una proporción, es decir, continuo pero delimitado entre 0 y 1?

1 votos

Si se trata de una proporción continua, puede que le resulte más adecuado un modelo beta que uno binomial. Dicho esto, la función de varianza de una cuasibinomial debería funcionar bien en ese caso (en el que la varianza beta es una versión escalada de p(1-p)), y funcionará para la subdispersión como sugiere Ben a continuación. Si sus datos no son típicamente cercanos a 0 o 1 puede funcionar muy bien.

9voto

Ben Bolker Puntos 8729

Mi respuesta de http://article.gmane.org/gmane.comp.lang.r.general/316863 :

respuesta corta: la estimación de la cuasibinomialidad (es decir, la familia= cuasibinomial) debería abordar la subdispersión así como la sobredispersión razonablemente bien

Si sólo quiere asumir que variance=ϕNp(1p) con ϕ<1 la estimación de cuasi-verosimilitud funcionará bien. Dependiendo del origen de la subdispersión, de lo mucho que le preocupe modelar los detalles y de otros aspectos de sus datos, puede que le interese considerar los métodos ordinal o COM-Poisson (ambos enfoques cuentan con paquetes R dedicados a ellos).

En general, hay menos preocupación por la subdispersión que por la sobredispersión; especulo que dos de las razones son

  • la dispersión excesiva es probablemente el problema más común
  • la subdispersión conduce al conservadurismo en la inferencia estadística (por ejemplo, disminución de la potencia, disminución de los errores de tipo I), en contraste con la dispersión excesiva que conduce al optimismo (tasa de error de tipo I inflada, etc.), por lo que los revisores, etc. tienden a no preocuparse tanto por ello

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X