Creo que su pregunta puede estar motivada por el hecho de que los glms log-lineales de Poisson pueden utilizarse para modelar tanto recuentos como frecuencias. Si count
es un vector de recuentos y of
es un vector de desplazamientos positivos, entonces los dos ajustes siguientes son equivalentes:
fit.count <- glm(count ~ x + offset(of), family=poisson)
y
frequency <- counts / of
fit.freq <- glm(frequency ~ x, family=poisson, weights=of)
Normalmente aquí of
es el tiempo total de exposición. En la primera versión, los recuentos se modelan de la forma habitual de glm, y el hecho de que los recuentos esperados sean proporcionales al tiempo de exposición se codifica en el desplazamiento.
En la segunda versión, calculamos la frecuencia de recuentos por unidad de tiempo de exposición. Esto elimina explícitamente la dependencia de los recuentos del tiempo de exposición, pero cambia la varianza. El argumento de las ponderaciones debe entonces reflejar el hecho de que las frecuencias basadas en los tiempos de exposición más largos son más precisas.
Aunque las dos variables de respuesta están en escalas diferentes, los dos ajustes glm son completamente equivalentes en todos los aspectos importantes. Darán las mismas estimaciones de coeficientes, las mismas desviaciones y los mismos valores p.
La equivalencia de los dos modelos ha sido señalada anteriormente por Alan Chalk en este foro: ¿Pueden las ponderaciones y la compensación conducir a resultados similares en la regresión de Poisson?
Este mismo truco se puede utilizar para cualquier glm con un offset y un log-link. También puede utilizarse para glms binomiales en los que la variable de respuesta puede ser el recuento binomial o la proporción de éxitos.