Las respuestas anteriores son más intuitivas, así que prueba con más rigor.
¿Qué es un GLM?
Vamos $Y=(y,\mathbf{x})$ denotar un conjunto de una respuesta $y$ y $p$-dimensional covariable vector $\mathbf{x}=(x_1,\dots,x_p)$ con un valor esperado de $E(y)=\mu$. Para $i=1,\dots,$ n observaciones independientes, la distribución de cada $y_i$ es una exponencial de la familia con la densidad de
$$
f(y_i;\theta_i,\phi)=\exp\{[y_i\theta_i-\gamma(\theta_i)]/\phi+\tau(y_i,\phi)\}
$$
Aquí, el parámetro de interés (natural o canónica parámetro) es de $\theta_i$, $\phi$ es un parámetro de escala (conocido o visto como una molestia) y $\gamma$ y $\tau$ son funciones conocidas. El $$n-dimensional vectores fijos los valores de entrada para el $p$ variables explicativas se denota por $\mathbf{x}_1,\dots,\mathbf{x}_p$. Suponemos que la entrada de vectores de influencia (1) sólo a través de una función lineal, el predictor lineal,
$$
\eta_i=\beta_0+\beta_1x_{i1}+\dots+\beta_px_{ip}
$$
después de que $\theta_i$ depende. Como se puede demostrar que $\theta=(\gamma')^{-1}(\mu)$, esta dependencia se establece mediante la conexión de la predictor lineal $\eta$ y $\theta$ a través de la media. Más concretamente, la media de $\mu$ es visto como una invertible y funcionamiento de la predictor lineal, es decir,
$$
g(\mu)=\eta\ \textrm{o}\ \mu=g^{-1}(\eta)
$$
Ahora, para responder a su pregunta:
La función $g(\cdot)$ se llama a la función de enlace. Si la función se conecta $\mu$ y $\theta$ tal que $\mu \equiv\theta$, entonces este enlace se llama canónica y tiene la forma $g=(\gamma')^{-1}$.
Eso es todo. A continuación, hay una serie de propiedades estadísticas deseables de utilizar el enlace canónico, por ejemplo, la suficiente estadística es de $X y$ con
los componentes de $\sum_i x_{ij} y_i$ para $j = 1, \dots, p$, el Método de Newton y Fisher scoring para encontrar el estimador ML coinciden, estos enlaces simplificar la derivación de la MLE, se aseguran de que algunas de las propiedades de la regresión lineal (por ejemplo, la suma de los residuos es 0) sostienen o se aseguran de que $\mu$ permanece dentro del rango de la variable de resultado.
Por lo tanto tienden a utilizarse de forma predeterminada. Tenga en cuenta sin embargo, que no existe a priori ninguna razón por la que los efectos en el modelo debe ser aditivo en la escala dada por este o cualquier otro enlace.