20 votos

De regresión de Poisson vs log-recuento de regresión de mínimos cuadrados?

Una regresión de Poisson es un GLM con un registro-función de enlace.

Una forma alternativa de modelo no tienen una distribución normal, los datos del conteo es para preprocesar tomando el registro (o más bien, log(1+count) para controlar el 0). Si vas a hacer una regresión de mínimos cuadrados en el registro de conteo de respuestas, es la relativa a una regresión de Poisson? Puede manejar fenómenos similares?

19voto

ocram Puntos 9992

Por un lado, en una regresión de Poisson, el lado izquierdo de la ecuación del modelo es el logaritmo de la esperada recuento: $\log(E[Y|x])$.

Por otro lado, en un "estándar" modelo lineal, el lado izquierdo es el valor esperado de la respuesta normal de la variable: $E[Y|x]$. En particular, la función de enlace es la función identidad.

Ahora, vamos a decir $Y$ es una variable de Poisson y que usted tiene la intención de normalizar al tomar el registro de: $Y' = \log(Y)$. Debido a $Y'$ se supone que para ser normal que el plan para ajustarse al estándar modelo lineal para que el lado izquierdo es $E[Y'|x] = E[\log(Y)|x]$. Pero, en general, $E[\log(Y) | x] \neq \log(E[Y|x])$. Como consecuencia de ello, estos dos modelos son diferentes.

9voto

dgw Puntos 360

Veo dos diferencias importantes.

En primer lugar, los valores de la predicción (en la escala original) se comportan diferente; en loglineal de mínimos cuadrados que representan condicional medios geométrica; en el registro de poisson modelo representan el medio condicional. Dado que los datos en este tipo de análisis son a menudo sesgada a la derecha, el condicional de la media geométrica se subestimar la media condicional.

Una segunda diferencia es la implícita distribución lognormal frente de poisson. Esto se refiere a la heterocedasticidad de la estructura de los residuos : varianza residual proporcional a los cuadrados de los valores esperados (lognormal) frente a la varianza residual proporcional al valor esperado (Poisson).

9voto

bdonlan Puntos 508

Una diferencia obvia es que la regresión de Poisson producirá enteros como punto de predicciones mientras que el registro de conteo de regresión lineal puede producir no enteros.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X