Loading [MathJax]/extensions/TeX/mathchoice.js

64 votos

¿Qué es la distribución cuasi-binomial (en el contexto del MLG)?

Espero que alguien pueda dar una visión intuitiva de lo que es la distribución cuasibinomial y lo que hace. Estoy particularmente interesado en estos puntos:

  1. En qué se diferencia la cuasibinomial de la distribución binomial.

  2. Cuando la variable de respuesta es una proporción (los valores de ejemplo incluyen 0,23, 0,11, 0,78, 0,98), un modelo cuasibinomial se ejecutará en R pero un modelo binomial no.

  3. Por qué deben utilizarse modelos cuasibinomiales cuando una variable de respuesta TRUE/FALSE está sobredispersa.

38voto

Rich Dougherty Puntos 1070
  1. La diferencia entre la distribución binomial y la cuasi-binomial puede verse en sus funciones de densidad de probabilidad (pdf), que caracterizan estas distribuciones.

    Binomio pdf:

    P(X=k)={n \choose k}p^{k}(1-p)^{n-k}

    Cuasi-binomio pdf:

    P(X=k)={n \choose k}p(p+k\phi)^{k-1}(1-p-k\phi)^{n-k}

    La distribución cuasi-binomial, aunque es similar a la distribución binomial, tiene un parámetro adicional \phi (limitado a |\phi| \le \min\{p/n, (1-p)/n\} ) que intenta describir la varianza adicional de los datos que no puede ser explicada únicamente por una distribución Binomial.

    (Nótese que la media de la distribución cuasi-binomial es p \sum_{i=0}^n \frac{n!\phi^i}{(n-k)!} en lugar de p sí mismo).

  2. No estoy seguro de esto, ¿quizás la función glm en R añade pesos en el modo cuasibinomial para tener en cuenta esto?

  3. La finalidad del parámetro adicional \phi es estimar la varianza adicional de los datos. Todo modelo lineal generalizado (MLG) hace una suposición de distribución para el resultado/respuesta y maximiza la probabilidad de los datos basándose en esta distribución. Es una elección que hace el analista, y si cree que necesita tener en cuenta más varianza en sus datos, entonces puede elegir la distribución cuasi-binomial para modelar la respuesta para su glm. Una buena forma de probar si necesitamos ajustar un modelo cuasi-binomial en lugar de uno binomial es ajustar un modelo cuasi-binomial, y probar para ver si el \phi es 0.

25voto

AdamSane Puntos 1825

La cuasi-binomial no es necesariamente una distribución particular; describe un modelo para la relación entre la varianza y la media en los modelos lineales generalizados que es \phi veces la varianza de una binomial en términos de la media de una binomial.

Hay una distribución que se ajusta a esa especificación (la obvia: una binomial escalada), pero ese no es necesariamente el objetivo cuando se ajusta un modelo cuasi-binomial; si se está ajustando a datos que siguen siendo 0-1 no puede ser una binomial escalada.

Así que el modelo de varianza cuasi-binomial, a través de la \phi puede tratar mejor los datos cuya varianza es mayor (o, tal vez, menor) de lo que se obtendría con los datos binomiales, sin ser necesariamente una distribución real.

Cuando la variable de respuesta es una proporción (los valores de ejemplo incluyen 0,23, 0,11, 078, 0,98), un modelo cuasibinomial se ejecutará en R pero un modelo binomial no

Que yo recuerde un modelo binomial se puede ejecutar en R con proporciones*, pero hay que tenerlo bien configurado.

* Hay tres formas distintas de dar datos binomiales a R que yo conozca. Estoy bastante seguro de que es uno.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X