Interpretación del gráfico en su caso
Nota: El eje "y" no siempre es el riesgo relativo, como en el ejemplo de la viñeta del dlnm
paquete. Este es sólo el caso de su ejemplo, porque utilizaron datos de mortalidad y modelos de regresión de Poisson. En su marco, el coeficiente de regresión exponencial de los modelos de Poisson $RR=\exp(\hat{\beta})$ es el riesgo relativo. Esto es análogo a la exponenciación de los coeficientes de regresión en la regresión logística, que es el odds ratio.
¿Puedo seguir utilizando el modelo?
Sí, todavía se puede utilizar ese modelo.
Resumamos lo que hace:
- Se utilizan B-splines cúbicos naturales como funciones base en lugar de polinomios para modelar la relación entre temperatura y $\mathrm{CO}_{2}$ (
arglag
con opción type="ns"
en lugar de type="poly"
)
- Se supone que el efecto de la temperatura es no lineal, ya que se especifica
argvar
como splines. Una cosa importante que hay que saber para la interpretación de los gráficos es que la función crossbasis
centra automáticamente los valores en la media del predictor (es decir, la temperatura media) si no se especifica lo contrario. Este es el valor de referencia con el que se comparan posteriormente las predicciones en los gráficos.
- Se consideran los rezagos hasta 12 (opción
lag=12
en crossbasis
). (Por cierto: ¿Por qué suprimen las advertencias?)
- Se calcula un MLG con errores gaussianos y la función de enlace de identidad, lo que equivale a una regresión lineal simple (OLS). Podría haber utilizado el
lm
en su lugar.
El gráfico que ha proporcionado se interpreta de la siguiente manera: El eje x es el desfase.
Interpretación de los valores del eje Y: El eje Y representa los cambios en $\mathrm{CO}_{2}$ asociada a un aumento de 10, 20 o 30°C con respecto a la temperatura media. Si el cambio previsto es 0, significa que un aumento de la temperatura no está asociado a un aumento de $\mathrm{CO}_{2}$ en comparación con $\mathrm{CO}_{2}$ a temperatura media: La predicción $\mathrm{CO}_{2}$ la concentración es la misma en $\bar{x}_{Temp}+z$ grados (donde $z$ es cualquier cantidad, digamos 10 o 20 grados) y a la temperatura media $\bar{x}_{Temp}$ .
Esto significa que para un aumento de la temperatura de 10°C, la temperatura en el lag 0 (en la misma hora) aumenta el $\mathrm{CO}_{2}$ concentración en comparación con la temperatura media. Porque usted especificó cumul=TRUE
en crosspred
Los efectos son acumulativos. Los efectos acumulativos de un aumento de 10°C son casi inexistentes después de 4 horas en comparación con la temperatura media. Esto sugiere que los efectos no acumulativos son negativos en los rezagos 1-4 y nulos a partir de entonces.
Para los aumentos de temperatura de 20 o 30°C, los efectos acumulados en el $\mathrm{CO}_{2}$ son menores en las primeras 1-4 horas en comparación con $\mathrm{CO}_{2}$ a la temperatura media. Al igual que con los aumentos de temperatura de 10°C, los efectos acumulados son prácticamente inexistentes después de 4 o 5 horas. De nuevo: $\mathrm{CO}_{2}$ Las concentraciones son las mismas a la temperatura media y a un aumento de la temperatura de 20 o 30°C después de 4 o 5 horas.
Creo que un gráfico de contorno sería más fácil de interpretar. Prueba el siguiente código:
plot(cp, xlab="Temperature", col="red", zlab="CO2", shade=0.6,
main="3D graph of temperature effect")
Interpretación del ejemplo dado en la viñeta del dlnm packge
En primer lugar, algo sobre modelos de retardo distribuido . Tienen la forma:
$$ Y_{i}=\alpha + \sum_{l=0}^{K}\beta_{j}x_{t-l} + \text{other predictors} +\epsilon_{i} $$ donde $K$ es el desfase máximo y $x$ es un predictor. Esto se acaba de ajustar utilizando una regresión lineal múltiple. Así que el coeficiente $\beta_{1}$ estimaría el efecto de $x_{t-1}$ del día anterior en $Y_{t}$ . En esencia, se incluyen en el modelo múltiples rezagos de los predictores simultáneamente. Obviamente, esto tiene el problema de que los predictores rezagados están muy correlacionados (autocorrelación).
Un método más avanzado son modelos de retardo distribuido polinómico . Tiene la misma fórmula básica que la anterior, pero la función impulso-respuesta se ve obligada a situarse en un polinomio de grado $q$ ( enlace a un documento para Stata):
$$ \beta_{i} = a_{0} + a_{1}i + a_{2}i^2 +\ldots+a_{q}i^q $$ donde $q$ es el grado del polinomio y $i$ la longitud del retraso. Otra formulación es $$ \beta_{i} = a_{0} + \sum_{j=1}^{q}a_{j}f_{j}(i) $$
Dónde $f_{j}(i)$ es un polinomio de grado $j$ en la longitud del retardo $i$ . Una buena introducción a la dlnm
y los modelos de retardo distribuido polinómico se pueden encontrar aquí .
Estos modelos se utilizan a menudo en los estudios sobre la contaminación atmosférica y la salud porque la contaminación atmosférica tiene efectos retardados en los resultados de salud.
Veamos este gráfico del viñeta del dlnm
paquete (página 13):
El grado de los polinomios fue $q=4$ en este caso por lo que la línea verde es un polinomio de 4º grado. El eje Y es el riesgo relativo (RR) estimado a través de la regresión de Poisson y el eje x el desfase considerado. El riesgo relativo tiene la siguiente interpretación: Las personas que estuvieron expuestas tienen un $(RR-1)\cdot100\%$ mayor/menor probabilidad de obtener el resultado (por ejemplo, muerte, cáncer de pulmón, etc.) en comparación con las personas que no estuvieron expuestas. Si $RR>1$ esto significa una asociación positiva y si $RR<1$ significa una asociación de protección. A $RR=1$ significa que no hay asociación. Vemos que por cada aumento de $\textrm{PM}_{10}$ en 10 unidades ( $\mu \mathrm{g}/m^{3}$ ), hay un $(1.001-1)\cdot100\%=0.1\%$ aumento del riesgo de morir en el lag 0 (es decir, el mismo día de la exposición). Curiosamente, la exposición de hace unos 9 días es protector: un aumento del 10 $~\mu \mathrm{g}/m^{3}$ se asocia a un disminuido riesgo de morir en comparación con las personas con 10 unidades menos de exposición. También podemos ver que la exposición de 15 días antes no influye (es decir $RR\approx1$ ).
Veamos el riesgo relativo acumulado:
Es lo mismo que antes, pero los efectos se acumulan a lo largo del tiempo (es decir, se suman todas las contribuciones de los rezagos hasta el rezago máximo). La línea roja comienza en el mismo punto que la línea verde del primer gráfico (es decir $\approx1.001$ ). Podemos ver que las personas que han estado expuestas durante cinco días tienen un riesgo acumulado mayor de aproximadamente $(1.005-1)\cdot100\%=0.5\%$ a morir en comparación con las personas no expuestas. Como la línea verde va por debajo del riesgo relativo de $1$ tras un desfase de unos 5 días, la asociación acumulada tras 15 días es casi $1$ . Esto significa que los efectos protectores de $\textrm{PM}_{10}$ a partir del retraso 5 han compensado los efectos nocivos de los retrasos anteriores. Que esto sea científicamente razonable es otra cuestión.