11 votos

¿Qué ventajas de regresión de Poisson tiene más de regresión lineal en este caso?

Me han dado un conjunto de datos que contiene el número de premios obtenidos por los alumnos en una escuela secundaria donde los predictores de la cantidad de premios ganados incluyen el tipo de programa en el que el estudiante estaba inscripto y la calificación de su examen final en la asignatura de matemáticas.

Me preguntaba si alguien podría decirme por qué un modelo de regresión lineal puede ser inadecuado en este caso y por qué sería mejor utilizar una regresión de Poisson? Gracias.

17voto

James Sutherland Puntos 2033

Tres puntos acerca de Poisson vs Normal de regresión, todo lo concerniente a especificación del modelo:

Efecto de los cambios en los predictores

Con una continua como predictor de matemáticas la puntuación de la prueba de regresión de Poisson (con el habitual registro de enlace) implica que un cambio de unidad en el predictor conduce a un cambio porcentual en el número de premios, es decir, 10 puntos más en la prueba de matemáticas se asocia con, por ejemplo, 25 por ciento más de los premios. Esto depende de la cantidad de premios que el estudiante ya se ha previsto tener. En contraste, la Normal de regresión asociados de más de 10 puntos con una cantidad fija, por ejemplo 3 más premios en todas las circunstancias. Usted debe ser feliz con esa suposición antes de usar el modelo que hace. (por lo que vale creo que es muy razonable, módulo del punto siguiente.)

El trato con los estudiantes sin premios

A menos que realmente hay muchos premios repartidos en que muchos de los estudiantes luego de su premio cuenta en su mayoría van a ser bastante bajas. De hecho, yo podría predecir cero inflación, es decir, la mayoría de los estudiantes no reciben ningún premio, así que un montón de ceros y unos buenos estudiantes obtener bastantes premios. Este se mete con los supuestos del modelo de Poisson y es al menos tan malo para el modelo Normal.

Si usted tiene una cantidad decente de datos de un 'cero-inflado' o 'obstáculo' modelo entonces sería natural. Se trata de dos modelos atados juntos: uno para predecir si el estudiante obtiene ningún premio, y otro para predecir cuántos ella consigue si se es que todos (generalmente de algún tipo de modelo de Poisson). Yo esperaría toda la acción a estar en el primer modelo.

Premio a la exclusividad

Por último, un pequeño punto sobre los premios. Si los premios son exclusivos, es decir, si un estudiante obtiene el premio luego hay otros estudiantes pueden obtener el premio, a continuación, sus resultados están acoplados, un cargo para el alumno empuja hacia abajo la posible recuento de cada uno. Si esto es vale la pena preocuparse depende de la entrega de premios de la estructura y el tamaño de la población estudiantil. Me gustaría ignorar que en una primera pasada.

En conclusión, Poisson cómodamente domina Normales, excepto por muy grande que cuenta, pero de verificación de los supuestos de la distribución de Poisson antes de inclinarse sobre ella fuertemente para la inferencia, y estar preparado para pasar a una ligeramente más complejo de la clase del modelo si es necesario.

3voto

Zizzencs Puntos 1358

@corone plantea buenos puntos, pero tenga en cuenta que la distribución de Poisson es sólo realmente asimétrica al $\lambda$ es pequeña. Incluso para $\lambda$ = 10, es bastante simétrica e..g.

set.seed(12345)
pois10 <- rpois(1000, 10)
plot(density(pois10))
library(moments)
skewness(pois10)

muestra una asimetría de 0.31, lo cual es bastante cercano a 0.

También me gusta @conjugateprior 's puntos. En mi experiencia, es raro que la regresión de Poisson para que se ajuste bien; yo generalmente de viento con una binomial negativa o cero-inflado modelo.

1voto

Neal Puntos 316

Ordinario de regresión de mínimos cuadrados de los premios en la predictores será el rendimiento consistente de las estimaciones de los parámetros mientras la media condicional de premios es lineal en los predictores. Pero esto es a menudo insuficiente ya que permite la predicción de la cantidad de premios a ser negativo (incluso para "razonable" de los valores de los predictores), que no tiene ningún sentido. La gente a menudo tratan de remediar esta tomando el logaritmo natural de premios y el uso de OLS. Pero esta falla, ya que algunos estudiantes no reciben premios, así que tienes que usar algo como $\ln(awards+0.5)$, pero esto crea sus propios problemas, ya que presumiblemente atención sobre los premios, y la re-transformación no es trivial.

También, como el número esperado de premios se hace muy grande, la OPERACIÓN debe realizar la mejor de las razones esbozadas por @Corone. En el Lago Wobegon, OLS es el camino a seguir.

Si el número es bajo, con un montón de ceros, me gustaría utilizar la distribución de Poisson con errores estándar robustos sobre el modelo binomial negativo. NB regresión hace un fuerte suposiciones acerca de las variaciones que aparecen en las condiciones de primer orden que producen los coeficientes. Si estos supuestos no se cumplen, los coeficientes de ellos mismos podrían estar contaminados. Que no es el caso con la distribución de Poisson.

0voto

Boar Puntos 48

De regresión de Poisson sería más suitible en este caso, ya que su respuesta es la cuenta de algo.

Poniendo las cosas simplemente, el modelo de que la distribución de número de premios para un estudiante en particular proviene de una distribución de poisson, y que cada estudiante tiene sus propios $\lambda$ de poisson de parámetro. La regresión de Poisson, a continuación, la relación de estos parámetros a las variables explicativas, en lugar de la cuenta.

La razón de esto es mejor que la normal de regresión lineal es que hacer con los errores. Si nuestro modelo es correcto, y cada estudiante tiene sus propios $\lambda$, para un determinado $\lambda$ sería de esperar una distribución de poisson de cuenta alrededor de ella, es decir, una distribución asimétrica. Esto significa inusualmente altos valores no son tan sorprendentes como inusualmente bajos.

Normal de regresión lineal se supone normal errores en torno a la media, y por lo tanto igual de pesos. Este dice que si un estudiante tiene un número esperado de premios de 1, es igual de probable que para ellos recibir -2 premios como para recibir los 3 premios: esto es claramente absurdo y lo de poisson es construido a la dirección.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X