29 votos

Intuición de la función de riesgo acumulativo (análisis de supervivencia)

Estoy tratando de intuir cada una de las funciones principales en la ciencia actuarial (específicamente para el Modelo de Riesgos Proporcionales de Cox). Esto es lo que tengo hasta ahora

  • $f(x)$ a partir de la hora de inicio, la distribución de probabilidad de cuándo morirás.
  • $F(x)$ : sólo la distribución acumulativa. En el tiempo $T$ ¿Qué porcentaje de la población morirá?
  • $S(x)$ : $1-F(x)$ . En el momento $T$ ¿qué porcentaje de la población seguirá viva?
  • $h(x)$ función de peligro. En un momento dado $T$ de las personas que siguen vivas, esto se puede utilizar para estimar cuántas personas morirán en el siguiente intervalo de tiempo, o si intervalo->0, probabilidad de muerte "instantánea".
  • $H(x)$ peligro acumulativo. Ni idea.

¿Cuál es la idea de combinar valores de peligro, especialmente cuando son continuos? Si utilizamos un ejemplo discreto con tasas de mortalidad a lo largo de cuatro estaciones, y la función de peligro es la siguiente:

  • A partir de la primavera, todo el mundo está vivo, y el 20% va a morir
  • Ahora en verano, de los que queden, el 50% morirá
  • Ahora en otoño, de los que queden, el 75% morirá
  • La última estación es Invierno. De los que quedan, el 100% morirá

Entonces, ¿el riesgo acumulado es del 20%, 70%, 145%, 245%? ¿Qué significa esto y por qué es útil?

13voto

nat Puntos 31

El libro "An Introduction to Survival Analysis Using Stata" (2ª edición) de Mario Cleves tiene un buen capítulo sobre este tema.

Encontrará el capítulo sobre google libros , p. 13-15. Pero yo aconsejaría leer todo el capítulo 2.

He aquí la forma abreviada:

  • "mide la cantidad total de riesgo que se ha acumulado hasta el momento t" (p. 8)
  • interpretación de los datos de recuento: "da el número de veces que esperaríamos (matemáticamente) observar fallos [u otros sucesos] a lo largo de un periodo determinado, si sólo el suceso de fallo fuera repetible" (p. 13)

12voto

jasonmray Puntos 1303

Yo <sup>PELIGRO </sup> una suposición de que es notable debido a su uso en parcelas de diagnóstico:

(1) En el modelo de riesgos proporcionales de Cox $h(x)=\mathrm{e}^{\beta^\mathrm{T} z}h_0(x)$ donde $\beta$ y $z$ son los vectores de coeficientes y covariables respectivamente, & $h_0(x)$ es la función de riesgo de base; & así $\log H(x)=\beta^\mathrm{T} z + H_0(x)$ . Si se traza la estimación $\log \hat{H}(x)$ contra $x$ , los diferentes patrones de covariables siguen curvas paralelas, siempre que el supuesto de riesgos proporcionales sea correcto.

(2) En el modelo de Weibull $h(x)=\frac{\alpha}{\theta}\left(\frac{x}{\theta}\right)^{\alpha-1}$ donde $\theta$ & $\alpha$ son los parámetros de escala y forma respectivamente; & por tanto $\log H(x) = \alpha \log x - \alpha \log \theta$ . Si se representa la estimación $\log \hat{H}(x)$ contra $\log x$ se obtiene una línea recta con pendiente $\hat{\alpha}$ & interceptar $-\hat{\alpha}\log\hat{\theta}$ siempre que la hipótesis de Weibull sea correcta. Y, por supuesto, una pendiente cercana a 1 sugiere que un modelo exponencial podría encajar.

Una interpretación intuitiva de $H(x)$ es el número esperado de muertes de un individuo hasta el momento $x$ si el individuo resucitara después de cada muerte (sin poner el tiempo a cero).

10voto

Cliff AB Puntos 3213

Parafraseando lo que dice @Scortchi, yo haría hincapié en que la función de riesgo acumulativo no tiene una interpretación agradable, y como tal no trataría de usarla como una forma de interpretar los resultados; decirle a un investigador no estadístico que los riesgos acumulativos son diferentes muy probablemente resultará en una respuesta "mm-hm" y entonces nunca volverán a preguntar sobre el tema, y no en el buen sentido.

Sin embargo, la función de riesgo acumulativo resulta ser muy útil desde el punto de vista matemático, como forma general de vincular la función de riesgo y la función de supervivencia. Así que es importante saber qué es el riesgo acumulado y cómo se puede utilizar en diversos métodos estadísticos. Pero, en general, no creo que sea especialmente útil pensar en los datos reales en términos de riesgos acumulativos.

8voto

Combinar proporciones muriendo como lo haces no te está dando peligro acumulativo. La tasa de peligrosidad en tiempo continuo es una probabilidad condicional de que durante un intervalo muy corto ocurra un suceso:

$$h(t) = \lim_{\Delta t \rightarrow 0} \frac {P(t<T \le t + \Delta t | T >t)} {\Delta t}$$

La peligrosidad acumulada es la integración de la tasa de peligrosidad (instantánea) a lo largo de las edades/tiempo. Es como sumar probabilidades, pero como $\Delta t$ es muy pequeña, estas probabilidades son también números pequeños (por ejemplo, la tasa de riesgo de morir puede ser de alrededor de 0,004 a edades en torno a los 30 años). La tasa de riesgo depende de que no se haya producido el suceso antes. $t$ por lo que para una población puede sumar más de 1.

Puedes buscar alguna tabla de vida de mortalidad humana, aunque se trata de una formulación en tiempo discreto, e intentar acumular $m_x$ .

Si usas R, aquí tienes un pequeño ejemplo de aproximación de estas funciones a partir del número de muertes en cada intervalo de edad de 1 año:

dx <-  c(3184L, 268L, 145L, 81L, 64L, 81L, 101L, 50L, 72L, 76L, 50L, 
         62L, 65L, 95L, 86L, 120L, 86L, 110L, 144L, 147L, 206L, 244L, 
         175L, 227L, 182L, 227L, 205L, 196L, 202L, 154L, 218L, 279L, 193L, 
         223L, 227L, 300L, 226L, 256L, 259L, 282L, 303L, 373L, 412L, 297L, 
         436L, 402L, 356L, 485L, 495L, 597L, 645L, 535L, 646L, 851L, 689L, 
         823L, 927L, 878L, 1036L, 1070L, 971L, 1225L, 1298L, 1539L, 1544L, 
         1673L, 1700L, 1909L, 2253L, 2388L, 2578L, 2353L, 2824L, 2909L, 
         2994L, 2970L, 2929L, 3401L, 3267L, 3411L, 3532L, 3090L, 3163L, 
         3060L, 2870L, 2650L, 2405L, 2143L, 1872L, 1601L, 1340L, 1095L, 
         872L, 677L, 512L, 376L, 268L, 186L, 125L, 81L, 51L, 31L, 18L, 
         11L, 6L, 3L, 2L)

x <- 0:(length(dx)-1) # age vector

plot((dx/sum(dx))/(1-cumsum(dx/sum(dx))), t="l", xlab="age", ylab="h(t)", 
     main="h(t)", log="y")
plot(cumsum((dx/sum(dx))/(1-cumsum(dx/sum(dx)))), t="l", xlab="age", ylab="H(t)", 
     main="H(t)")

Espero que esto ayude.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X