2 votos

¿La tasa de riesgo media con el modelo de riesgos proporcionales de Cox es siempre mayor que la tasa de riesgo sin ninguna variable explicativa?

Estoy estimando un modelo de riesgos proporcionales de Cox con y sin variables explicativas. Sin variables explicativas, la tasa de riesgo es simplemente la proporción de todos los individuos que fallaron en el momento $t$ de todos los individuos que duraron al menos un tiempo $t$ .

Después de estimar el modelo con covariables, calculo el peligro previsto para cada observación de la muestra utilizada para ajustar el modelo multiplicando el peligro de referencia por $\exp(z_i'\beta)$ . A continuación, hago una media del riesgo de base previsto para cada unidad de tiempo entre todos los individuos que aún no han fracasado en ese momento.

Mi problema es que la tasa de riesgo promediada es siempre mayor que la tasa de riesgo del modelo sin ninguna variable explicativa. Las variables explicativas no varían con el tiempo y la muestra utilizada para estimar ambos modelos es exactamente la misma. Véase la figura siguiente como ejemplo:

Figure 1

Mis preguntas son:

1) ¿Es esto posible o estoy haciendo algo mal? No entiendo cómo la tasa de riesgo media de todos los individuos es mayor que la tasa de riesgo del modelo sin variables en cada momento.

2) ¿Cuál debería ser la relación entre las medias de las dos estimaciones de riesgo? Debería ser:

$\frac{\sum_t \sum_i \text{Hazard Rate w/ explanatory variables for observation i at time t}}{\sum_t \text{Number of Observations at time t}} = \frac{\sum_t \text{Hazard rate without explanatory variables at time t}\times \text{Number of observations at time t}}{\sum_t\text{Number of observations at time t}}$

1voto

Mike Barrett Puntos 57

Esta es la respuesta que publiqué en Statalist:

http://www.statalist.org/forums/forum/general-stata-discussion/general/790265-average-hazard-rate-with-cox-proportional-hazard-model-always-larger-than-the-hazard-rate-without-any-explanatory-variables

Observo que allí has presentado el código sólo para una única variable explicativa.

Las dos medias estarán cerca, pero se me ocurren algunas razones por las que podrían ser sistemáticamente diferentes en una sola muestra.

  1. El modelo estimado es incorrecto: ¿ha comprobado el ajuste del modelo mediante prueba de estado (prueba de riesgos proporcionales) o linktest (pruebas de linealidad y (con otras covariables) interacciones)?

  2. Sesgo del método de verosimilitud de Breslow por defecto en presencia de datos muy ligados.

  3. Variabilidad aleatoria en los coeficientes de regresión estimados en una sola muestra.

  4. Los riesgos estimados con coeficientes son la media de los términos no lineales en $\hat{\beta}$ con pesos que dependen de las estimaciones. Así que esperaría un sesgo sistemático incluso si el verdadero $\beta$ fueron sustituidos, sesgo que disminuiría al aumentar el tamaño de los conjuntos de riesgo.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X