15 votos

Cómo interpretar las estimaciones de los parámetros de Poisson GLM resultados

Call:
glm(formula = darters ~ river + pH + temp, family = poisson, data = darterData)

Deviance Residuals:
    Min      1Q   Median     3Q    Max
-3.7422 -1.0257   0.0027 0.7169 3.5347

Coefficients:
              Estimate Std.Error z value Pr(>|z|)
(Intercept)   3.144257  0.218646  14.381  < 2e-16 ***
riverWatauga -0.049016  0.051548  -0.951  0.34166
pH            0.086460  0.029821   2.899  0.00374 **
temp         -0.059667  0.009149  -6.522  6.95e-11 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

(Dispersion parameter for poisson family taken to be 1)
Null deviance: 233.68 on 99 degrees of freedom
Residual deviance: 187.74 on 96 degrees of freedom
AIC: 648.21

Quiero saber cómo interpretar cada una estimación del parámetro en la tabla de arriba.

34voto

trish Puntos 31

No creo que el título de tu pregunta la captura con precisión lo que usted está pidiendo.

La cuestión de cómo interpretar los parámetros en un GLM es muy amplio debido a que el GLM es muy amplia clase de modelos. Recordemos que un GLM modelos de una variable de respuesta $y$ que se supone que siguen una distribución conocida de la exponencial de la familia, y que se ha escogido una función invertible $g$ tal que $$ \mathrm{E}\left[y\,|\,x\right] = g^{-1}{\left(x_0 + x_1\beta_1 + \dots + x_J\beta_J\right)} $$ para $J$ variables predictoras $x$. En este modelo, la interpretación de un determinado parámetro de $\beta_j$ es la tasa de cambio de $g(y)$ con respecto al $x_j$. Definir $\mu \equiv \mathrm{E}{\left[y\,|\,x\right]} = g^{-1}{\left(x\right)}$ $\eta \equiv x \cdot \beta$ para mantener la notación limpio. Entonces, para cualquier $j \in \{1,\dots,J\}$, $$ \beta_j = \frac{\partial\,\eta}{\parcial\,x_j} = \frac{\partial\,g(\mu)}{\parcial\,x_j} \text{.} $$ Ahora defina $\mathfrak{e}_j$ a ser un vector de $J-1$ ceros y un solo $1$ $j$th posición, de modo que por ejemplo si $J=5$$\mathfrak{e}_3 = \left(0,0,1,0,0\right)$. Entonces $$ \beta_j = g{\left(\mathrm{E}{\left[y\,|\,x + \mathfrak{e}_j \right]}\right)} - g{\left(\mathrm{E}{\left[y\,|\,x\right]}\right)} $$

Lo que significa que $\beta_j$ es el efecto sobre la $\eta$ de una unidad de incremento en $x_j$.

También puede indicar la relación de esta manera: $$ \frac{\operatorname{\parcial}\mathrm{E}{\left[y\,|\,x\right]}}{\operatorname{\partial}x_j} = \frac{\operatorname{\parcial}\mu}{\operatorname{\partial}x_j} = \frac{\operatorname{d}\mu}{\operatorname{d}\eta}\frac{\operatorname{\partial}\eta}{\operatorname{\partial}x_j} = \frac{\operatorname{\parcial}\mu}{\operatorname{\parcial}\eta} \beta_j = \frac{\operatorname{d}g^{-1}}{\operatorname{d}\eta} \beta_j $$ y $$ \mathrm{E}{\left[y\,|\,x + \mathfrak{e}_j \right]} - \mathrm{E}{\left[y\,|\,x\right]} \equiv \operatorname{\Delta_j} \hat y = g^{-1}{\left( \left(x + \mathfrak{e}_j\right)\beta \right)} - g^{-1}{\left( x\,\beta \right)} $$

Sin saber nada acerca de $g$, que es lo máximo que podemos conseguir. $\beta_j$ es el efecto sobre la $\eta$, en la transformación de media condicional de $y$, de una unidad de incremento en $x_j$, y el efecto sobre la media condicional de $y$ de una unidad de incremento en $x_j$$g^{-1}{\left(\beta\right)}$.


Pero usted parece estar pidiendo específicamente acerca de regresión de Poisson utilizando R predeterminado de la función de enlace, que en este caso es el logaritmo natural. Si ese es el caso, usted está preguntando acerca de un tipo específico de GLM en que $y \sim \mathrm{Poisson}{\left(\lambda\right)}$$g = \ln$. A continuación, podemos conseguir algo de tracción con respecto a una interpretación específica.

De lo que he dicho anteriormente, sabemos que $\frac{\operatorname{\partial}\mu}{\operatorname{\partial}x_j} = \frac{\operatorname{d}g^{-1}}{\operatorname{d}\eta} \beta_j$. Y ya sabemos $g(\mu) = \ln(\mu)$, también sabemos que $g^{-1}(\eta) = e^\eta$. También hemos enterado de lo que $\frac{\operatorname{d}e^\eta}{\operatorname{d}\eta} = e^\eta$, por lo que podemos decir que $$ \frac{\operatorname{\parcial}\mu}{\operatorname{\partial}x_j} = \frac{\operatorname{\parcial}\mathrm{E}{\left[y\,|\,x\right]}}{\operatorname{\partial}x_j} = e^{x_0 + x_1\beta_1 + \dots + x_J\beta_J}\beta_j $$

lo que finalmente significa algo tangible:

Dado un cambio muy pequeño en $x_j$, el amueblada $\hat y$ cambios $\hat y\,\beta_j$.

Nota: esta aproximación puede realmente trabajar por cambios tan grandes como 0.2, dependiendo de cuánta precisión que usted necesita.

Y el uso de la más conocida de la unidad de cambio de la interpretación, tenemos: \begin{align} \operatorname{\Delta_j} \hat y &= e^{ x_0 + x_1\beta_1 + \dots + \left(x_j + 1\right)\,\beta_j + \dots + x_J\beta_J } - e^{x_0 + x_1\beta_1 + \dots + x_J\beta_J} \\ &= e^{ x_0 + x_1\beta_1 + \dots + x_J\beta_J + \beta_j} - e^{x_0 + x_1\beta_1 + \dots + x_J\beta_J} \\ &= e^{ x_0 + x_1\beta_1 + \dots + x_J\beta_J}e^\beta_j - e^{x_0 + x_1\beta_1 + \dots + x_J\beta_J} \\ &= e^{ x_0 + x_1\beta_1 + \dots + x_J\beta_J} \left( e^\beta_j - 1 \right) \end{align} lo que significa que

Dado un cambio de unidad en $x_j$, el amueblada $\hat y$ cambios $\hat y \left( e^\beta_j - 1 \right)$.

Hay tres elementos importantes a destacar aquí:

  1. El efecto de un cambio en los predictores depende del nivel de la respuesta.
  2. Un aditivo cambio en los predictores tiene un efecto multiplicativo sobre la respuesta.
  3. Usted no puede interpretar los coeficientes sólo por su lectura (a menos que usted puede calcular arbitraria exponenciales en su cabeza).

Así, en el ejemplo, el efecto de aumentar el pH por 1 es aumentar el $\ln \hat y$$\hat y \left( e^{0.09} - 1 \right)$; es decir, multiplicar $\hat y$ $e^{0.09} \approx 1.09$ . Parece que el resultado es el número de jugadores, se observa en algunos fijos unidad de tiempo (por ejemplo, una semana). Así que si usted está observando 100 dardos de una semana a un pH de 6.7, aumentar el pH del río a 7.7 significa que usted puede ahora esperar a ver 109 dardos de la semana.

6voto

anand Puntos 199

Mi sugerencia sería la de crear una pequeña red eléctrica que consta de las combinaciones de los dos ríos y dos o tres valores de cada una de las covariables, a continuación, utilizar la predict función con su rejilla newdata. A continuación, un gráfico de los resultados. Es mucho más claro para ver los valores que el modelo realmente predice. Usted puede o no desea realizar una transformación de las predicciones para el original de la escala de medición (type = "response").

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X