En el paquete R AER encontrará la función dispersiontest
que implementa un Prueba de sobredispersión de Cameron y Trivedi (1990).
Sigue una idea sencilla: en un modelo de Poisson, la media es $E(Y)=\mu$ y la varianza es $Var(Y)=\mu$ también. Son iguales. La prueba simplemente pone a prueba este supuesto como hipótesis nula frente a una alternativa en la que $Var(Y)=\mu + c * f(\mu)$ donde la constante $c < 0$ significa sub-dispersión y $c > 0$ significa sobredispersión. La función $f(.)$ es alguna función monótona (a menudo lineal o cuadrática; la primera es la predeterminada).La prueba resultante es equivalente a probar $H_0: c=0$ contra. $H_1: c \neq 0$ y el estadístico de prueba utilizado es un $t$ que es asintóticamente normal bajo la nulidad.
Ejemplo:
R> library(AER)
R> data(RecreationDemand)
R> rd <- glm(trips ~ ., data = RecreationDemand, family = poisson)
R> dispersiontest(rd,trafo=1)
Overdispersion test
data: rd
z = 2.4116, p-value = 0.007941
alternative hypothesis: true dispersion is greater than 0
sample estimates:
dispersion
5.5658
Aquí vemos claramente que hay indicios de sobredispersión (c se estima en 5,57), lo que se opone a la hipótesis de equidispersión (es decir, c=0).
Tenga en cuenta que si no utiliza trafo=1
, en realidad hará una prueba de $H_0: c^*=1$ contra. $H_1: c^* \neq 1$ con $c^*=c+1$ que tiene, por supuesto, el mismo resultado que la otra prueba, aparte de que la estadística de la prueba se desplaza en uno. Sin embargo, la razón de esto es que esta última corresponde a la parametrización común en un modelo de cuasi-Poisson.