8 votos

¿Generalizar el modelo lineal generalizado el modelo lineal general?

De Wikipedia

El modelo lineal general (GLM) es un estadístico modelo lineal. Puede ser escrito como1 $$ \mathbf{Y} = \mathbf{X}\mathbf{B} + \mathbf{U}, $$ donde $Y$ es una matriz con la serie multivariante de las mediciones, $X$ es una matriz que podría ser un diseño de la matriz, $B$ es una matriz que contiene los parámetros que suelen ser estimada y $U$ es una matriz que contenga errores o ruido. Los errores son generalmente supone que siguen una distribución normal multivariante.

Luego dice

Si los errores no siguen una distribución normal multivariante, modelos lineales generalizados puede ser usado para relajarse suposiciones acerca de $Y$$U$.

Me preguntaba cómo los modelos lineales generalizados relajarse suposiciones acerca de $Y$ $U$ en el general de modelos lineales?

Tenga en cuenta que puedo entender su otra relación en la dirección opuesta:

El modelo lineal general puede ser visto como un caso de la modelo lineal generalizado con la identidad de enlace.

Pero dudo que esto va a ayudar con mi pregunta.

10voto

Sean Hanley Puntos 2428

Considere un caso en su variable de respuesta es un conjunto de "éxitos" y "fracasos" (también representado como 'sí' y el 'nos', $1$s y $0$s, etc.). Si esto fuera verdad, no puede ser el caso de que su error plazo es normalmente distribuida. En su lugar, el término de error sería de Bernoulli, por definición. Por lo tanto, uno de los supuestos en los que se alude a la violación. Otra suposición es que de homoskedasticity, pero esto sería violado así, porque la varianza es una función de la media. Así que podemos ver que el (OLS) GLM es inadecuado para este caso.

Tenga en cuenta que, para un típico modelo de regresión lineal, lo que se predicción (es decir, $\hat y_i$)$\mu_i$, la media de la condicional de la distribución normal de la respuesta en ese punto exacto donde $X=x_i$. Lo que necesitamos en este caso es predecir $\hat\pi_i$, la probabilidad de "éxito" en ese lugar. Así que pensamos en nuestra respuesta a la distribución de Bernoulli, y estamos prediciendo el parámetro que controla el comportamiento de la distribución. Hay una complicación importante aquí, sin embargo. En concreto, habrá algunos valores de $\bf X$ que, en combinación con sus estimaciones $\boldsymbol\beta$ el rendimiento de los valores de la predicción de $\hat y_i$ (i.e, $\hat\pi_i$) que va a ser $<0$ o $>1$. Pero esto es imposible, debido a que el rango de $\pi$$(0,~1)$. Por lo tanto, tenemos que transformar el parámetro de $\pi$, de modo que puede extenderse a $(-\infty,~\infty)$, así como el lado derecho de su GLiM puede. Por lo tanto, se necesita una función de enlace.

En este punto, se han estipulado una respuesta de distribución (Bernoulli) y una función de enlace (tal vez el logit de la transformación). Ya tenemos una parte estructural de nuestro modelo: $\bf X \boldsymbol \beta$. Así que ahora tenemos todas las piezas necesarias de nuestro modelo. Este es ahora el modelo lineal generalizado, porque nos han "relajado" que las suposiciones acerca de nuestra variable de respuesta y los errores.

Para responder a sus preguntas específicas más directamente, el modelo lineal generalizado relaja suposiciones acerca de $\bf Y$ $\bf U$ por la postulación de una respuesta de distribución (en la exponencial de la familia) y una función de enlace a la que se asigna el parámetro en cuestión para el intervalo de $(-\infty,~\infty)$.

Para más información sobre este tema, puede ayudar a leer mi respuesta a esta pregunta: la Diferencia entre los modelos logit y probit.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X