16 votos

La función de enlace de identidad no respeta el dominio de la familia Gamma?

La estoy usando con una gamma modelo lineal generalizado (GLM) con una identidad enlace. La variable independiente es la compensación de un grupo en particular.

Python statsmodels resumen me está dando una advertencia acerca de la identidad de la función de enlace ("DomainWarning: La identidad de la función de enlace no respetar el dominio de la Gamma de la familia.") que no entiendo y me gustaría un poco de ayuda. Fondo: Sólo básico de la educación formal en las estadísticas y prácticamente ninguna experiencia con GLMs más allá de la regresión logística.

Aquí está el correspondiente código de Python:

model=statsmodels.genmod.generalized_linear_model.GLM(target, reducedFeatures, family=sm.families.Gamma(link=sm.families.links.identity)) results=model.fit() print(results.summary())

Aquí está el resultado: enter image description here

Mi pregunta es esta: ¿En qué manera una identidad enlace no respetar el dominio de la Gamma de la familia? El dominio de la gamma de la familia es de 0 a infinito? Yo también estaba bajo la impresión de que la identidad link no estaba haciendo nada de nada, es decir, es mantener las variables independientes como es y no transformar a ellos, a su relación con la variable dependiente. Suena como un respetuoso función de enlace ;)

Por favor me corrija

12voto

eldering Puntos 3814

La Gamma GLM modelo es:

$$ y \mid X \sim \text{Gamma} (\mu = f(X\beta), \phi) $$

Donde $\mu$ es la expectativa de parámetro, y $\phi$ es un parámetro de dispersión (dispersión de parámetros no se estima en el estándar de GLM marco), $X\beta$ es el predictor lineal, $\beta$ son los parámetros aprendido por el modelo, y $f$ se llama a la función de enlace.

Tenga en cuenta que, mientras que $X\beta$ se le permite tomar cualquier valor real, $f(X\beta)$ es el modelado de la expectativa de una distribución Gamma, el cual debe ser un número real positivo. Esto es lo que Python está diciendo, la identidad de la función no se garantiza el mapa de $X\beta$ a un número real positivo, por lo que no siempre se traduce en un medio de parámetros.

Fresco. Gracias! Todas mis variables independientes son positivos, los números reales, así que yo soy bueno para ir, ¿verdad?

No necesariamente, uno de sus coeficientes estimados podrían ser negativos (intercepción que es muy negativo).

¿Te importaría ir a un poco más de detalle lo que quieres decir? ¿Por qué el signo de la intersección tiene ningún impacto sobre los coeficientes? Que no tiene sentido para mí.

Tiene un efecto en la media del parámetro de su condicional de la distribución Gamma. Recuerde, su estructura de la ecuación del modelo es:

$$ \mu = f(X \beta) $$

y $\mu$ debe ser positivo. Supongamos que es válido que todos los valores de las variables predictoras ser cero (no sé si este es el caso de los datos, ya que me falta contexto para sus características). A continuación, la predicción para este punto de datos sería:

$$ \mu(x) = f \left( (1, 0, 0, \cdots, 0) \cdot \beta \right) = f(\text{Intercept}) $$

Si usted está utilizando la identidad de la función de enlace, esto significa que

$$ \mu(x) = \text{Intercept} $$

que es un valor no válido de $\mu$ cuando la intersección es negativo.

De nuevo, debido a las limitaciones contextuales de sus datos, usted puede evitar esta situación, pero es matemáticamente posible.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X