De regresión de Poisson puede ser llevada a cabo utilizando Agrupados y sin agrupar los datos. Debe haber algunas diferencias entre estos dos métodos. Para estar seguro, he tratado de estudiar las diferencias en el uso de un conjunto de datos simulados. El resultado que encontraron fue que la estimación de los parámetros serán los mismos para ambos métodos, pero el residual deviances son muy diferentes.
Entonces, esto me trae a la pregunta de si existe la suposición de que la satisfacción de las necesidades antes de que podamos agrupar nuestros datos.
# Rcode for simulated data #
rm(list=ls())
set.seed(1)
##############################################################
# Creating Random Age, Gender, obs count and population #
##############################################################
nsim = 10000
age = sample(20:70,size = nsim, replace = T)
Gender = sample(c("M","F"),size = nsim, replace = T)
obs.count = sample(c(0,0,1),size = nsim, replace = T)
population = sample(c(0.7,0.8,0.9,1), size=nsim, replace = T)
ungrouped.data = data.frame(age,Gender,obs.count,population)
grouped.data = aggregate(cbind(ungrouped.data$obs.count,ungrouped.data$population),list(ungrouped.data$age,ungrouped.data$Gender), FUN = "sum")
names(grouped.data) = c("age", "Gender", "obs.count", "population")
############################################
# GLM model for group and ungroup data set #
############################################
model.group = glm(obs.count ~ age + Gender + offset((log(population))), family = poisson, data = grouped.data)
summary(model.group)
model.ungroup = glm(obs.count ~ age + Gender + offset((log(population))), family = poisson, data = ungrouped.data)
summary(model.ungroup)