4 votos

Diferentes valores de p para anova() y summary() en glm.nb

utilizando este código

library(MASS)
n = c(300, 200, 100) 
group = rep(1:3, n)
x=c(rnbinom(300, size=2, mu=2.47), rnbinom(200, size=2, mu=2.27),
rnbinom(100, size=2, mu=2.27))
glm1 = glm.nb(x ~ factor(group))

He creado tres neg. distribuciones binomiales y analizados mediante un glm. La variable independiente (grupo) está destinado a ser categorial. Cuando utilizo anova(glm1), me da un p-valor (Pr>Chi)) de 0,07. Sin embargo, cuando utilizo summary(glm1), puedo obtener un p-valor (Pr (>|z|) de 0,2 para el factor 2 y 0,02 para el factor 3. Por lo tanto, dependiendo de si puedo usar summary() o anova(), el factor es significativo o no. Tengo tres preguntas y sería muy feliz si alguien me pudiera ayudar con uno de estos.

  1. Puedo concluir que si el grupo es un factor importante o no?
  2. Los residuos no se distribuyen normalmente. Puedo usar anova(glm1) no obstante?
  3. Al parecer, summary() me da una intercepción y dos factores. Hacer el dos factores se refieren a la diferencia entre el grupo 1 y 2 respectivamente, entre el grupo 1 y 3?

Yo realmente apreciaría tu ayuda, solo una pequeña sugerencia en uno de estos cuestión sería genial. Por favor, dime, si falta información o si yo no me expreso de manera comprensible.

5voto

Vincent Puntos 1064

El resumen.glm() para glm es la prueba de Wald para que el nivel de factor (en comparación con el nivel de base), mientras que el análisis de varianza.glm() es el Chisquared-prueba (basado en la desviación) para el conjunto de la variable de factor. Así que la importancia de los test Wald puede ser mal entendido a veces.

En este caso, el resumen.negbin es el mismo resumen.glm, proporcionando la prueba de Wald. Por otro lado, el análisis de varianza.negbin proporciona secuencial de razón de verosimilitud de las pruebas.

Respecto a sus preguntas.

  1. factor del grupo no es significativo, y se puede quitar.

  2. análisis de varianza.negbin() se basa en la prueba de razón de verosimilitud.

  3. Sí. (Si, independientemente de la función de enlace,) la estimación de los valores para el factor es la diferencia esperada de la predictor lineal, en comparación con el nivel de base.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X