Soy nuevo y todavía necesito aprender más. Tengo varias preguntas, estoy tratando de crear un modelo de regresión binomial negativa usando R y library(MASS). Pero todavía me confunde qué debería usar glm (Y~X1+X2+X3+X4+X5+X6+X7, family=negative.binomial(theta), data, maxit) o glm.nb.
¿Cuál es la diferencia entre esas dos funciones? [alguien dijo que si no conocemos el parámetro de sobredispersión no podemos usar glm(), así que glm.nb() es la opción; y otra persona dijo, en glm.nb() se asume que theta=1].
Por otro lado, todavía estoy confundido acerca de theta, en algún foro de discusión dijeron que theta es un parámetro de sobredispersión, pero otros dijeron que theta es un parámetro de forma para la distribución y que la sobredispersión es lo mismo que k, como se discutió en The R Book (Crawley 2007).
He leído un tutorial sobre regresión binomial negativa con R (pero para mí no parece muy correcto). En ese tutorial, sugiere probar y error qué valor de theta hasta que la deviance residual sea igual a los grados de libertad con glm (Y~X1+X2+X3+X4+X5+X6+X7, family=negative.binomial(theta), data, maxit)
Disculpen mi mal inglés