Tengo una pregunta sobre la interpretación de parámetros para un GLM con una variable dependiente distribuida gamma. Esto es lo que R devuelve para mi GLM con un enlace logarítmico:
Llamada:
glm(formula = ingreso ~ altura + edad + educación + casado + sexo + idioma + secundaria,
familia = Gamma(link = log), data = fakesoep)
Residuos de desviación:
Min 1Q Mediana 3Q Máx
-1.47399 -0.31490 -0.05961 0.18374 1.94176
Coeficientes:
Estimación Error estándar valor t Pr(>|t|)
(Intercepto) 6.2202325 0.2182771 28.497 < 2e-16 ***
altura 0.0082530 0.0011930 6.918 5.58e-12 ***
edad 0.0001786 0.0009345 0.191 0.848
educación 0.0119425 0.0009816 12.166 < 2e-16 ***
casado -0.0178813 0.0173453 -1.031 0.303
sexo -0.3179608 0.0216168 -14.709 < 2e-16 ***
idioma 0.0050755 0.0279452 0.182 0.856
secundaria 0.3466434 0.0167621 20.680 < 2e-16 ***
---
Códigos de significancia: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Parámetro de dispersión para la familia Gamma tomado como 0.1747557)
Desviación nula: 757.46 en 2999 grados de libertad
Desviación residual: 502.50 en 2992 grados de libertad
AIC: 49184
¿Cómo interpreto los parámetros? Si calculo exp(coef())
de mi modelo, obtengo alrededor de 500 para el intercepto. ¿Eso no significa el ingreso esperado si se mantienen constantes todas las demás variables, verdad? Dado que el promedio o media(edad)
se encuentra en ~ 2000. Además, no tengo ni idea de cómo interpretar la dirección y el valor de los coeficientes de las covariables.
7 votos
500 estaría cerca del ingreso esperado si todas las demás variables fueran exactamente cero (no solo constantes) --- al igual que en la regresión, en realidad.
0 votos
@Glen_b ¿por qué se esperaría que sea ingreso cuando el exponencial de los coeficientes es el efecto multiplicativo en el ingreso cuando hay un cambio en la variable explicativa?
0 votos
El caso bajo discusión es la media condicional cuando todas las variables explicativas son 0.