He realizado un glm.nb por
glm1<-glm.nb(x~factor(group))
siendo el grupo una variable categórica y x una variable métrica. Cuando intento obtener el resumen de los resultados, obtengo resultados ligeramente diferentes, dependiendo de si utilizo summary()
o summary.glm
. summary(glm1)
me da
...
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 0.1044 0.1519 0.687 0.4921
factor(gruppe)2 0.1580 0.2117 0.746 0.4555
factor(gruppe)3 0.3531 0.2085 1.693 0.0904 .
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for Negative Binomial(0.7109) family taken to be 1)
mientras que summary.glm(glm1) me da
...
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.1044 0.1481 0.705 0.4817
factor(gruppe)2 0.1580 0.2065 0.765 0.4447
factor(gruppe)3 0.3531 0.2033 1.737 0.0835 .
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for Negative Binomial(0.7109) family taken to be 0.9509067)
Entiendo el significado del parámetro de dispersión, pero no el de la línea
(Dispersion parameter for Negative Binomial(0.7109) family taken to be 0.9509067)
.
En el manual dice, que sería la dispersión estimada, pero parece ser una mala estimación, ya que 0,95 no se acerca a 0,7109, ¿o la dispersión estimada es algo diferente al parámetro de dispersión estimado? Supongo que, tengo que establecer la dispersión en el summary.nb(x, dispersion=)
a algo, pero no estoy seguro, si tengo que poner la dispersión a 1 (que dará el mismo resultado que summary()
o si debo insertar una estimación del parámetro de dispersión, que en este caso conduce a summary.nb(glm1, dispersion=0.7109)
¿o algo más? O estoy bien con sólo usar el summary(glm1)
?
3 votos
Utiliza summary() ya que despacha al método S3 apropiado para la clase negbin. La dispersión debe ser, por supuesto, 1, lo que se estima es theta, que es mejor llamar parámetro de forma para evitar confusiones. Ver también stats.stackexchange.com/questions/27773/how-does-glm-nb-work/