89 votos

La diferencia entre ' enlace función ' y ' función link canónico ' GLM

¿Cuál es la diferencia entre los términos ' enlace ' y 'vínculo canónico función'? ¿También, hay ninguna ventaja (teórica) de usar uno sobre el otro?

por ejemplo, una variable de respuesta binaria se puede modelar usando muchas funciones de enlace como «logit», etc. «probit». Sin embargo, logit aquí se considera el enlace 'canónico'.

89voto

Momo Puntos 5125

Las respuestas anteriores son más intuitivas, así que prueba con más rigor.

¿Qué es un GLM?

Vamos $Y=(y,\mathbf{x})$ denotar un conjunto de una respuesta $y$ y $p$-dimensional covariable vector $\mathbf{x}=(x_1,\dots,x_p)$ con un valor esperado de $E(y)=\mu$. Para $i=1,\dots,$ n observaciones independientes, la distribución de cada $y_i$ es una exponencial de la familia con la densidad de $$ f(y_i;\theta_i,\phi)=\exp\{[y_i\theta_i-\gamma(\theta_i)]/\phi+\tau(y_i,\phi)\} $$ Aquí, el parámetro de interés (natural o canónica parámetro) es de $\theta_i$, $\phi$ es un parámetro de escala (conocido o visto como una molestia) y $\gamma$ y $\tau$ son funciones conocidas. El $$n-dimensional vectores fijos los valores de entrada para el $p$ variables explicativas se denota por $\mathbf{x}_1,\dots,\mathbf{x}_p$. Suponemos que la entrada de vectores de influencia (1) sólo a través de una función lineal, el predictor lineal, $$ \eta_i=\beta_0+\beta_1x_{i1}+\dots+\beta_px_{ip} $$ después de que $\theta_i$ depende. Como se puede demostrar que $\theta=(\gamma')^{-1}(\mu)$, esta dependencia se establece mediante la conexión de la predictor lineal $\eta$ y $\theta$ a través de la media. Más concretamente, la media de $\mu$ es visto como una invertible y funcionamiento de la predictor lineal, es decir, $$ g(\mu)=\eta\ \textrm{o}\ \mu=g^{-1}(\eta) $$ Ahora, para responder a su pregunta:

La función $g(\cdot)$ se llama a la función de enlace. Si la función se conecta $\mu$ y $\theta$ tal que $\mu \equiv\theta$, entonces este enlace se llama canónica y tiene la forma $g=(\gamma')^{-1}$.

Eso es todo. A continuación, hay una serie de propiedades estadísticas deseables de utilizar el enlace canónico, por ejemplo, la suficiente estadística es de $X y$ con los componentes de $\sum_i x_{ij} y_i$ para $j = 1, \dots, p$, el Método de Newton y Fisher scoring para encontrar el estimador ML coinciden, estos enlaces simplificar la derivación de la MLE, se aseguran de que algunas de las propiedades de la regresión lineal (por ejemplo, la suma de los residuos es 0) sostienen o se aseguran de que $\mu$ permanece dentro del rango de la variable de resultado.

Por lo tanto tienden a utilizarse de forma predeterminada. Tenga en cuenta sin embargo, que no existe a priori ninguna razón por la que los efectos en el modelo debe ser aditivo en la escala dada por este o cualquier otro enlace.

18voto

StasK Puntos 19497

Gung del citado una buena explicación: el vínculo canónico posee especiales propiedades teóricas de mínima suficiencia. Esto significa que puede definir un modelo logit condicional (que los economistas llaman un modelo de efectos fijos) de acondicionamiento en el número de resultados, pero no se puede definir un modelo probit condicional, porque no hay ninguna estadística suficiente para usar con el enlace de probit.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X