25 votos

¿Adónde va el desplazamiento en regresión binomial Poisson/negativa?

(En primer lugar, sólo para confirmar, un desplazamiento de la variable de funciones básicamente de la misma manera en Poisson y binomial negativa de regresión, ¿verdad?)

La lectura sobre el uso de un desplazamiento variable, a mí me parece que la mayoría de las fuentes se recomienda incluir esa variable como una opción en paquetes estadísticos (exp() en Stata o offset() en R). Es que funcionalmente de la misma como la conversión de su variable de resultado a una proporción si usted es el modelado de los datos de recuento, y hay un número finito de que el recuento podría haber sucedido? Mi ejemplo es mirar el despido de los empleados, y creo que el offset aquí sería simplemente de registro(número de empleados).

Y como un agregado de pregunta, estoy teniendo problemas con la conceptualización de lo que es la diferencia entre estas dos primeras opciones (incluyendo la exposición como una opción en el software y la conversión de la DV a una proporción) y entre ellas la exposición en el lado derecho como control. Cualquier ayuda se agradece.

59voto

Factor Mystic Puntos 12465

Hay que recordar que un desplazamiento es sólo una variable de predictor cuyo coeficiente se ha fijado en 1. Usando la configuración estándar para una regresión de Poisson con un enlace de registro, por lo tanto, tenemos:

$$\log \mathrm{E}(Y) = \beta' \mathrm{X} + \log \mathcal{E}$$

where $\mathcal{E}$ is the offset/exposure variable. This can be rewritten as

$$\log \mathrm{E}(Y) - \log \mathcal{E} = \beta' \mathrm{X}$$ $$\log \mathrm{E}(Y/\mathcal{E}) = \beta' \mathrm{X}$$

Your underlying random variable is still $Y$, but by dividing by $\mathcal{E}$ we've converted the LHS of the model equation to be a rate of events per unit exposure. But this division also alters the variance of the response, so we have to weight by $\mathcal{E}$ al ajustar el modelo.

Ejemplo en R:

library(MASS) # for Insurance dataset

# modelling the claim rate, with exposure as a weight
# use quasipoisson family to stop glm complaining about nonintegral response
glm(Claims/Holders ~ District + Group + Age,
    family=quasipoisson, data=Insurance, weights=Holders)

Call:  glm(formula = Claims/Holders ~ District + Group + Age, family = quasipoisson, 
    data = Insurance, weights = Holders)

Coefficients:
(Intercept)    District2    District3    District4      Group.L      Group.Q      Group.C        Age.L        Age.Q        Age.C  
  -1.810508     0.025868     0.038524     0.234205     0.429708     0.004632    -0.029294    -0.394432    -0.000355    -0.016737  

Degrees of Freedom: 63 Total (i.e. Null);  54 Residual
Null Deviance:      236.3 
Residual Deviance: 51.42        AIC: NA


# with log-exposure as offset
glm(Claims ~ District + Group + Age + offset(log(Holders)),
    family=poisson, data=Insurance)

Call:  glm(formula = Claims ~ District + Group + Age + offset(log(Holders)), 
    family = poisson, data = Insurance)

Coefficients:
(Intercept)    District2    District3    District4      Group.L      Group.Q      Group.C        Age.L        Age.Q        Age.C  
  -1.810508     0.025868     0.038524     0.234205     0.429708     0.004632    -0.029294    -0.394432    -0.000355    -0.016737  

Degrees of Freedom: 63 Total (i.e. Null);  54 Residual
Null Deviance:      236.3 
Residual Deviance: 51.42        AIC: 388.7

4voto

Brian Hasden Puntos 2501

La compensación actúa semejantemente para Poisson y NB. El desplazamiento tiene dos funciones. Para los modelos de Poisson, el número real de eventos define la varianza, por lo que de necesario. También proporciona el denominador, así que usted puede comparar las tasas. Es menos unir.

Usando una proporción de desordenar los errores estándar. Tener un modelo, que se ocupa de la compensación como Poisson la mayoría funciones de modelo de regresión lo cuida tanto los errores estándar y comparación de las tasas.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X