16 votos

Sobredispersión y Underdispersion negativa regresión Binomial/Poisson

I, se realiza una regresión de Poisson en SAS y se encontró que la prueba de Pearson valor de chi-cuadrado dividido por los grados de libertad fue de alrededor de 5, lo que indica importantes sobredispersión. Así que, me ajuste un modelo binomial negativo con proc genmod y encontró la prueba de Pearson valor de chi-cuadrado dividido por los grados de libertad es de 0,80. Es ahora considerado underdispersed? Si es así, ¿cómo se hace para que el manejo de este? He leído mucho acerca de sobredispersión y creo que sé cómo manejar esto, pero la información sobre cómo controlar o determinar si hay underdispersion es escasa. ¿Alguien puede ayudar?

Gracias.

25voto

Nathan Long Puntos 30303

Para una distribución de Poisson con una media de $\mu$ de la varianza también es $\mu$. En el marco de los modelos lineales generalizados esto implica que la varianza de la función es $$V(\mu) = \mu$$ para el modelo de Poisson. Este supuesto modelo que puede ser malo por muchas razones diferentes. Overdispersed los datos de recuento con una varianza mayor que lo que la distribución de Poisson se dicta, por ejemplo, a menudo se encuentran.

Las desviaciones de la varianza de la hipótesis en un contexto de regresión tomar varias formas. La más simple es que la varianza de la función es igual a $$V(\mu) = \psi \mu$$ con $\psi > 0$ un parámetro de dispersión. Este es el cuasi-modelo de Poisson. Se dará el mismo modelo de regresión ajustada, pero la inferencia estadística ($p$-valores y los intervalos de confianza) se ajusta para la sobre - dispersión excesiva o escasa usando un estimado del parámetro de dispersión.

La forma funcional de la varianza de la función también puede ser malo. Podría ser un polinomio de segundo grado $$V(\mu) = a\mu^2 + b \mu + c,$$ decir. Los ejemplos incluyen la binomial, la binomial negativa y la gama del modelo. La elección de cualquiera de estos modelos como una alternativa al modelo de Poisson afectarán a la equipada con el modelo de regresión, así como el posterior inferencia estadística. Para la distribución binomial negativa con forma de parámetros $\lambda > 0$ de la varianza de la función es $$V(\mu) = \mu\left( 1 + \frac{\mu}{\lambda}\right).$$ Aquí podemos ver que si $\lambda \to \infty$ obtenemos la varianza de la función de la distribución de Poisson.

Para determinar si la variación de la función de la distribución de Poisson modelo es adecuado para los datos, podemos estimar la dispersión de parámetros como el OP sugiere y comprobar si es aproximadamente 1 (tal vez usando una formales de prueba). Tal prueba no sugieren una alternativa específica, pero es el que más claramente se entiende dentro de la cuasi-modelo de Poisson. Para probar si la forma funcional de la varianza de la función es apropiado, w e podría construir una prueba de razón de verosimilitud del modelo de Poisson ($\lambda = \infty$) contra el modelo binomial negativo ($\lambda < \infty$). Tenga en cuenta que tiene un no estándar de la distribución bajo la hipótesis nula. O podríamos usar AIC-métodos basados, en general, para la comparación de no-modelos anidados. De regresión basadas en pruebas para la sobredispersión en el modelo de Poisson explora una clase de pruebas para la varianza general de las funciones.

Sin embargo, yo recomendaría primero de todo estudio de gráficos de residuos, por ejemplo, una parcela de la prueba de Pearson o la desviación de los residuos (o su cuadrado valor) contra los valores ajustados. Si la forma funcional de la varianza está mal, verá esto como una forma de embudo (o una tendencia de los cuadrados de los residuos) en los residuos de la parcela. Si la forma funcional es la correcta, es decir, no embudo o tendencia, todavía podría ser sobre - dispersión excesiva o escasa, pero esto puede ser explicada por la estimación del parámetro de dispersión. El beneficio de los residuales de la trama es que sugiere más claramente que una prueba de lo que está mal con la varianza de la función si nada.

En la OP del caso concreto no es posible decir si 0.8 indica underdispersion de la información dada. En lugar de centrarse en el 5 y el 0,8 estimaciones, que me sugieren, en primer lugar investigar el ajuste de la variación de las funciones de la distribución de Poisson modelo y el modelo binomial negativo. Una vez que la más apropiada es la forma funcional de la varianza de la función está determinada, una dispersión de parámetros se puede incluir, si es necesario, en cualquiera de modelo para ajustar la inferencia estadística para cualquier adicional sobre - dispersión excesiva o escasa. Cómo hacer fácilmente en SAS, decir que, desafortunadamente, no es algo que me puede ayudar con.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X