Tengo un sitio web sencillo con una página de inicio que tiene 5 imágenes diferentes. Todas las imágenes tienen un conjunto fijo de "características" asociadas (tamaño, color, posición, etc.). Cuando un visitante entra en la página, puede hacer clic en una de las imágenes o simplemente salir.
Para un intervalo de tiempo determinado, dado que tanto el número de visualizaciones de la página como el número de clics en una imagen son "recuentos", pueden modelizarse como VR de Poisson. Quiero construir un modelo de regresión para la tasa de clics (CTR), es decir, # clics / # vistas (donde # vistas es común a las 5 imágenes y # clics es obviamente diferente).
Estoy utilizando el modelo lineal generalizado (glm) en R para esto:
model <- glm(log(numClicks) ~ (features) + offset(log(numViews)), family=poisson, data=mydata)
¿Es éste el enfoque correcto? No sé si es correcto tomar la razón de dos Poissons en combinación con la función canónica de enlace logarítmico y glm.
¿Existe una forma mejor de modelar el CTR?