7 votos

Robustez de GLM para vincular la función

Cuando me enteré de la existencia de GLMs me enseñaron que la función de enlace no era tan importante, tan largo como el dominio y el codominio de partido. Por ejemplo, en una regresión logística ciertamente necesitamos $g: (0,1) \rightarrow \mathbb R$ pero más allá de eso no nos importa mucho. También me enteré de que el enlace canónico hace las matemáticas más fácil, pero no importa demasiado más allá de eso.

Más recientemente, sin embargo, me he encontrado con casos donde la función de enlace es estimado. Si mis profesores estaban en lo correcto en que los resultados son robustos a la función de enlace, ¿por qué queremos ir a todo el esfuerzo de la estimación?

10voto

AdamSane Puntos 1825

Si usted es montaje sólo nominal de los predictores categóricos (y los modelos de orden completo), la función de enlace será esencialmente de ninguna consecuencia-en el sentido de que no se altera el ajuste.

He aquí un ejemplo de uso de registro y vínculos de identidad con una Poisson glm. Primero los datos (y es la respuesta, un conde, y x1f y x2f tienen los niveles de los factores):

 y    157  909  249  144  876  248   34  205   62   26  243   48
 x1f    1    1    1    1    1    1    2    2    2    2    2    2
 x2f    1    2    3    1    2    3    1    2    3    1    2    3

He aquí los valores ajustados por el modelo completo con la interacción:

> fitted(glm(y~x1f+x2f+x1f:x2f,family=poisson(link="log")))
    1     2     3     4     5     6     7     8     9    10    11    12 
150.5 892.5 248.5 150.5 892.5 248.5  30.0 224.0  55.0  30.0 224.0  55.0 

> fitted(glm(y~x1f+x2f+x1f:x2f,family=poisson(link="identity")))
    1     2     3     4     5     6     7     8     9    10    11    12 
150.5 892.5 248.5 150.5 892.5 248.5  30.0 224.0  55.0  30.0 224.0  55.0 

Vemos que el ajuste no cambia aunque la función de enlace hizo.

Si usted es montaje modelos categóricos que dejar algunas interacciones (tales como efectos principales sólo en el modelo), entonces la función de enlace importa, porque en algunas funciones de enlace, estas interacciones pueden, de hecho, desaparecen, dejando el modelo más pequeño adecuado y más fácil de interpretar) -- pero, a continuación, los más simples, los modelos aditivos no ser adecuados para otras funciones de enlace.

Continuando con el ejemplo anterior, la omisión de las interacciones:

> fitted(glm(y~x1f+x2f,family=poisson(link="log")))
        1         2         3         4         5         6         7         8 
145.65183 900.94330 244.90487 145.65183 900.94330 244.90487  34.84817 215.55670 
        9        10        11        12 
 58.59513  34.84817 215.55670  58.59513 

> fitted(glm(y~x1f+x2f,family=poisson(link="identity")))
        1         2         3         4         5         6         7         8 
238.72879 618.67616 268.07978 238.72879 618.67616 268.07978  21.90564 401.85300 
        9        10        11        12 
 51.25663  21.90564 401.85300  51.25663 

Ahora vemos que los valores ajustados son de hecho diferentes. En este caso, el vínculo de registro le da un ajuste razonable, pero la identidad de enlace da bastante mal ajuste.

Si usted es montaje continuo predictores, a continuación, puede importar un poco, incluso ignorando el problema de las interacciones. Un ejemplo sería con el binomio GLMs -- en muchos casos, el ajuste con un probit y un cloglog enlace puede verse muy diferente, aunque ambos tienen $g$ de los que tomaron $(0,1)$$\mathbb{R}$.

Lo mucho que te importa realmente depende de los detalles del problema y de su tolerancia de desviación.

En muchos casos, la facilidad de interpretación es más importante que las diferencias en el ajuste (por lo menos donde esas diferencias tienden a ser pequeñas), pero tiene la competencia entre lo fácil que es la función de enlace es a tratar y cómo interpretar el predictor lineal es, y usted también tiene el problema de la posible falta de ajuste: si su curva relacionadas con la media de su binomio variables para el predictor(s) no es simétrica, puede ser mucho más interpretables para elegir un más adecuado vínculo de expandir el modelo de la clase.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X