1 votos

Comparación de varios tipos de modelos (Poisson, Binomio Negativo, ZINB)

Estoy trabajando con datos de recuento de OTU (esencialmente recuentos de lecturas de secuencias agrupadas), y tratando de determinar la abundancia diferencial de recuentos entre dos grupos. Por el momento, estamos utilizando un método definido en el artículo de Romero, et al titulado "La composición y estabilidad de la microbiota vaginal de las mujeres embarazadas normales es diferente de la de las mujeres no embarazadas", mediante el cual ajustamos el modelo utilizando Poisson, NB y ZINB (aplicando efectos mixtos cuando tenemos medidas repetidas), encontramos el modelo con el mejor ajuste (usando AIC/BIC), y usamos esos coeficientes y valores p para generar valores q y determinar OTUs significativamente abundantes entre los dos grupos que estamos comparando.

Mis preguntas son las siguientes: (1) Si mi modelo se parece a OTU ~ treatment ou OTU ~ treatment + (1|studyid) ¿es mejor el AIC o el BIC? Los mismos individuos estarán en todas las comparaciones, así que no piense en que me preocupan las diferencias en el tamaño de la muestra. Romero utiliza el AIC, pero también parece haber algún argumento a favor del BIC, y no estoy seguro de en qué casos uno es más correcto que el otro.

(2) En la misma línea, supongo que puedo utilizar el AIC/BIC para las versiones de efectos mixtos de Poisson, NB y ZINB. Estoy utilizando las versiones implementadas en R utilizando el lme4 y glmmADMB paquetes.

(3) Algunos de mis modelos no convergen y, hasta ahora, he tomado los modelos que no convergen y los considero no relevantes desde el punto de vista biológico. Por lo tanto, descarto los coeficientes/valores resultantes y sólo comparo los modelos que convergen. ¿Tiene esto sentido? ¿O debo considerar que los modelos que no convergen pueden seguir siendo útiles?

Sé que estas preguntas no se pueden validar en un banco, pero no estoy seguro de cómo crear un guión que sea lo más fiel posible a las bacterias que encontramos en nuestras muestras.

1voto

Knarpie Puntos 143

(1) Cuál es mejor es una discusión muy teórica. En la práctica, el BIC penaliza más el número de parámetros y, por lo tanto, tiene una mayor preferencia por los modelos parsimoniosos (por ejemplo, Poisson en lugar de NB) que el AIC. Sin embargo, no me gusta este enfoque, ya que la bondad del ajuste puede estar relacionada con la hipótesis probada. La distribución de Poisson es definitivamente demasiado optimista en términos de variabilidad para los datos del microbioma. Creo que se debería utilizar la misma distribución (y las mismas covariables en los modelos) para todos los taxones para poder compararlos.

(2) Supongo que sí, pero vea (1)

(3) Es un enfoque muy peligroso. De nuevo, la no convergencia podría estar relacionada con la hipótesis probada. Más concretamente, esto podría desbaratar la corrección de pruebas múltiples (conversión a valores q), ya que se basa en el conjunto de valores P

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X