La gamma tiene una propiedad que comparte con la lognormal, a saber, que cuando el parámetro de forma se mantiene constante mientras se varía el parámetro de escala (como suele hacerse cuando se utiliza cualquiera de los dos para los modelos), la varianza es proporcional a la media al cuadrado (coeficiente de variación constante).
Algo parecido a esto ocurre con bastante frecuencia con los datos financieros o, de hecho, con muchos otros tipos de datos.
Como resultado, suele ser adecuado para datos continuos, positivos, sesgados a la derecha y cuya varianza es casi constante en la escala logarítmica, aunque hay otras opciones bien conocidas (y a menudo bastante disponibles) con esas propiedades.
Además, es habitual ajustar un enlace logarítmico con el MLG gamma (es relativamente más raro utilizar el enlace natural). Lo que lo hace ligeramente diferente de ajustar un modelo lineal normal a los logaritmos de los datos es que en la escala logarítmica la gamma está sesgada a la izquierda en diversos grados mientras que la normal (el logaritmo de una lognormal) es simétrica. Esto hace que (la gamma) sea útil en una variedad de situaciones.
He visto usos prácticos de los GLM gamma discutidos (con ejemplos de datos reales) en (lo que se me ocurre) de Jong & Heller y Libera así como numerosos artículos; también he visto aplicaciones en otras áreas. Ah, y si no recuerdo mal, Venables y Ripley's MASS lo utiliza en el absentismo escolar (los datos de la quina; Editar: resulta que en realidad está en Estadísticas Complementos del MASS (ver p11, la página 14 del pdf, tiene un enlace de registro pero hay un pequeño desplazamiento del DV). Uh, y McCullagh y Nelder hicieron un ejemplo de coagulación de la sangre, aunque tal vez puede haber sido enlace natural.
Luego está El libro de Faraway donde hizo un ejemplo de seguro de coche y un ejemplo de datos de fabricación de semiconductores.
Elegir cualquiera de las dos opciones tiene algunas ventajas y algunos inconvenientes. Como hoy en día ambas son fáciles de colocar, en general es cuestión de elegir la más adecuada.
Está lejos de ser la única opción; por ejemplo, también hay GLMs gaussianos inversos, que son más asimétricos/de cola más pesada (e incluso más heteroskedásticos) que gamma o lognormal.
En cuanto a los inconvenientes, es más difícil hacer intervalos de predicción. Algunas pantallas de diagnóstico son más difíciles de interpretar. Calcular las expectativas en la escala del predictor lineal (generalmente la escala logarítmica) es más difícil que para el modelo lognormal equivalente. Las pruebas de hipótesis y los intervalos son generalmente asintóticos. Suelen ser problemas relativamente menores.
Tiene algunas ventajas sobre la regresión logarítmica normal (tomar los logaritmos y ajustar un modelo de regresión lineal ordinario); una de ellas es que la predicción de la media es fácil.
2 votos
Llego bastante tarde a la conversación, pero estoy interesado en la regresión Gamma, ya que cumple los mismos propósitos que la regresión de Poisson (hasta donde yo sé), pero debido a su forma continua, es más fácil para los cálculos de gradiente - lo que potencialmente hace que sea una mejor opción para el software de modelado bayesiano que utiliza HMC/NUTS de muestreo basado en el gradiente, como PyMC3, Stan, etc. (Tengo curiosidad por saber qué piensan los demás)