5 votos

Puedo multiplicar y ronda proporción de datos para el análisis en un GL(M)con errores de Poisson?

Tal vez el dumbiest pregunta alguna vez publicado en el CV:

Quiero analizar la relación entre la proporción de datos y algunas covariables en un lineales generalizados (mixto, pero no creo que lo que importa) modelo.

La distribución natural a utilizar sería la binomial, pero la mayoría de las proporciones son cercanos a 0, y su distribución se parece a una (ligeramente overdispersed) Poisson.

Mis proporciones son, por definición, no valores enteros, por lo que no puede ser directamente modelada utilizando algunas implementaciones de gl(m)con errores de Poisson. Por ejemplo yo estoy usando MCMCglmm en R que (con razón) sólo permite valores enteros (y Beta-binomial no está implementado).

Podría simplemente multiplique mi proporción por digamos 1000 (para mantener cierta exactitud), alrededor de ellos (para hacerlos entero) y hacer el glmm de Poisson con errores en ellos. Entonces yo podría cambiar la escala de las estimaciones de los parámetros (y en glmm la relativa importancia de los componentes de varianza será el mismo)?

Supongo (tal vez erróneamente) que no habría problema con esto, pero como he sido incapaz de encontrar discutido en algún lugar, estoy empezando a dudar, y estaría encantado si otros que piensan acerca de esto más adelante puede encontrar una respuesta (lo que sea) aquí.

Muchas gracias por el apoyo.

3voto

mat_geek Puntos 1367

No veo por qué usted quiere tomar proporciones y el modelo con distribución de Poisson. Las proporciones son, posiblemente, cualquier número en [0,1], mientras que la distribución de Poisson es discreto sobre los enteros no negativos. Una distribución beta tendría más sentido como un modelo. También ya que dicen que usted espera que p sea dependiente de las covariables, tal vez los datos que puede ver es una mezcla de proporciones binomiales donde p depende de los valores de la covariable.

1voto

James Billingham Puntos 131

Una posible forma de evitar esto es utilizar un desplazamiento:

Achim Zeileis dice (aquí: http://www.mail-archive.com/r-help@r-project.org/msg69617.html):

Si se trata de una relación de (valor entero) cuenta en el numerador y algunos conocidos denominador, dicen relación = count/denom entonces un enfoque estándar sería de ajuste

glm(recuento ~ ..., offset = log(denom), data = ..., de la familia = poisson)

porque esto corresponde a registro(recuento) = x'beta + log(denom) <=> log(count/denom) = x'beta

Y aquí es cómo hacerlo con MCMCglmm: http://markmail.org/thread/66hxxbikx5a4yzam#query:+página:1+media:dgrpip73futd3vok+estado:resultados

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X