6 votos

Función de supervivencia de una variable que tiene componentes discretos y continuos

Actualmente estoy leyendo The Statistical Analysis of Failure Time Data de Kalbfleisch y Prentice y he tenido problemas para llegar a la expresión de la función de supervivencia de una variable aleatoria $T$ con componentes discretos y continuos. La configuración es la siguiente:

Dejemos que $T$ sea una variable aleatoria en $[0,\infty)$ con función de supervivencia $F(t)=P(T>t)$ . Entonces

  • si $T$ es absolutamente continua con densidad $f$ entonces la función de riesgo $\lambda$ puede definirse como $$ \lambda(t):=\lim_{h\to 0^+}\frac{P(t\leq T<t+h\mid T\geq t)}{h}=\frac{f(t)}{F(t)} $$ para $t\geq 0$ y por lo tanto tenemos $$ F(t)=\exp\left(-\int_0^t\lambda(s)\,\mathrm ds\right),\quad t\geq 0. $$

  • si $T$ es discreto tomando los valores $0\leq a_1<a_2<\cdots$ entonces definimos el peligro en $a_i$ como $$ \lambda_i=P(T=a_i\mid T\geq a_i),\quad i=1,2,\ldots. $$ Entonces podemos demostrar que $$ F(t)=\prod_{j\mid a_j\leq t}(1-\lambda_j),\quad t\geq 0. $$

Estas expresiones para las funciones de supervivencia me parecen bien. Ahora escriben lo siguiente:

En general, la distribución de $T$ puede tener componentes discretos y continuos. En este caso, la función de peligro puede definirse con el componente continuo $\lambda_c(t)$ y componentes discretos $\lambda_1,\lambda_2,\ldots$ en los momentos discretos $a_1<a_2<\cdots$ . La función global de supervivencia puede escribirse entonces $$ F(t)=\exp\left(-\int_0^t\lambda_c(s)\,\mathrm ds\right)\prod_{j\mid a_j\leq t}(1-\lambda_j).\tag{1} $$

Que $T$ tiene componentes discretos y continuos significa que la distribución de $T$ es de la forma $$ P_T(\mathrm dx)=f_c(x) \lambda(\mathrm dx)+\sum_{j=1}^\infty b_j \delta_{a_j}(\mathrm dx) $$ o de forma equivalente $$ P(T\in A)=\int_A f_c(x)\,\mathrm dx+\sum_{j\mid a_j\in A} b_j $$ para alguna secuencia $a_1<a_2<\cdots$ y $b_i\in (0,1)$ y alguna función medible no negativa $f_c$ con $\int_0^\infty f_c\,\mathrm d\lambda+\sum_{i=1}^\infty b_j=1$ . Si definimos $$ \lambda_c(t)=\frac{f_c(t)}{P(T\geq t)}=\frac{f_c(t)}{F(t)},\quad t\neq a_i, $$ y $$ \lambda_i=P(T=a_i\mid T\geq a_i), $$ entonces cómo demuestro (y si es cierto) que la función de supervivencia de $T$ viene dada por $(1)$ ?

1 votos

No veo el problema aquí: los autores consideran las relaciones entre la función de supervivencia y la función de riesgo por separado para el caso en que hay densidad y para el caso en que la distribución es puramente discreta. En $(1)$ combinan los resultados para la distribución que tiene una parte continua y otra puramente discreta. Ahora, para $t\neq a_j$ definen $\lambda_c(t) = f(t)/F(t)$ mientras que para $t = a_j$ utilizan la segunda fórmula.

0 votos

@Ilya: Gracias por la respuesta. Supongo que mi pregunta es, ¿cuál es la definición de una variable que tiene tanto una parte continua como una parte puramente discreta?

0 votos

Bueno, no creo que en un curso orientado a la teoría de la medida se encuentre una definición formal de la misma, pero lo más probable es que se refieran a que la distribución $\mu_T$ de $T$ viene dada por $$ \mu_T(\mathrm dx) = f_c(x)\lambda(\mathrm dx) + \sum_{j}b_j \delta_{a_j}(\mathrm dx) $$ donde $f_c$ es una función de "subdensidad", y $\lambda$ es la medida de Lebesgue.

3voto

Grant Puntos 116

La función $F(t) = \mathsf P(T>t) = 1-\mathsf P(T\leq t)$ es claramente de clase RCLL en $[0,\infty)$ . En consecuencia, las definiciones de la parte continua de la función de peligro $\lambda_c$ y las piezas discretas le permiten computar $F$ mediante la integración de $\lambda_c$ entre los saltos, y aplicando condiciones de salto en $t = a_j$ . Estos últimos tienen la siguiente forma: $$ \lambda_j = \mathsf P(T = a_j\mid T\geq a_j) = \frac{F(a_j-) - F(a_j)}{F(a_j-)}\implies F(a_j) = F(a_j-)(1-\lambda_j) $$ donde $F(t-):=\lim_{s\uparrow t}F(s)$ .

1 votos

Cambió algunos $S$ 's a $F$ Espero que sea lo que pretendías escribir. Gracias por su ayuda.

0 votos

@StefanHansen: gracias

0 votos

Stefan lo que no entiendo es que en el libro de Kalbfleisch y Prentice definen $F(t) = P(T \geq t)$ en la página 6 en lugar de $F(t) = P(T > t)$ la forma en que la define. De ahí que en el denominador de la fracción en el post de @Ilya no veo cómo $P(T \geq a_j)$ puede convertirse en $\lim\limits_{t\to a_j^{-}}F(t)$ dada la definición del libro no debería ser simplemente F(a_j). Lo que nos lleva a preguntarnos cómo han llegado los autores a la función de supervivencia general que citas en (1) :S

1voto

Oliver Diaz Puntos 1

Puede que sea muy tarde, pero me gustaría dar mi opinión sobre esta cuestión.

Supongamos que $\mu$ es una medida de probabilidad sobre $((0,\infty),\mathscr{B}((0,\infty))$ y que $F(x):=\mu(0,x]$ . El Función de peligro integrada $Q$ de $\mu$ se define como $$ Q(t)=\int_{(0,t]}\frac{1}{1-F(x-)}\mu(dx). $$ La función $S(t):=1-F(t)$ es una función monótona derecha no creciente. $Q$ es una función monótona no decreciente de derecha cuya medida asociada (Lebesgue-Stieltjes) $\mu_Q\ll\mu$ satisface $$ \begin{align} \mu_{Q}(\{x\})&=\Delta Q(x)=\frac{\Delta F(x)}{S(x-)}\\ \mu_{Q_c}(dx)&=\frac{1}{S(x-)}\mu_{F_c}(dx)\\ S(x-)\mu_Q(dx)&=\mu(dx)=\mu_F(dx). \end{align} $$ donde $F_c$ y $Q_c$ es la parte continua de $F$ y $Q$ respectivamente. Entonces, $Q$ y $F$ tienen los mismos puntos de discontinuidad $\{x_j:j\in I\}$ y como $S(t)=1-F(t)=1-\int_{(0,t]}\mu(dx)$ , $$ \begin{align} S(t)=S(0)-\int_{(0,t]}S(x-)\mu_Q(dx)\tag{1}\label{one} \end{align} $$ Demostraremos que $S$ es la única solución de $\eqref{one}$ que está acotado en cualquier conjunto acotado, y que $$ S(t)=\exp\big(-Q_c(t)\big)\prod_{0<x_j\leq t} (1-\Delta Q(x_j)). $$


La prueba de esto será una consecuencia del siguiente teorema:

Teorema: Dejemos que $F$ sea una función monótona no decreciente a la derecha en $[0,\infty)$ y que $\mu_F$ sea la única medida sobre $(0,\infty)$ tal que $\mu\big((a,b]\big)=F(b)-F(a)$ . Sea $\{x_j:j\in\mathbb{N}\}$ sea la secuencia de todas las discontinuidades de $F$ . Si $v\in\mathcal{L}^{loc}_1(\mu_F)$ entonces, para cualquier número $H_0\geq0$ la función $$ \begin{align} H(t)=H_0\exp\Big(\int_{(0,t]}v(x)\mu_{F_c}(dx)\Big)\prod_{0<x_j\leq t}(1+v(x_j)\Delta F(x_j))\tag{2}\label{expo-form} \end{align} $$ es la única solución en $t\geq0$ de la ecuación integral \begin{align} \label{integro-exp} H(t)=H(0)+\int_{(0,t]}H(x-)v(x)\mu_F(dx) \end{align} Satisfaciendo a $\|H\mathbb{1}_{(0,t]}\|_u<\infty$ para todos $t>0$ .


La fórmula citada en el PO es $\eqref{one}$ y la existencia y unicidad se obtienen por el Teorema anterior con $v\equiv-1$ .


Desde la fórmula $\eqref{expo-form}$ aparece a menudo en aplicaciones Análisis de la supervivencia y la teoría de la fiabilidad, creo que vale la pena presentar una prueba. Ésta se basará enteramente en la integración por partes de Lebesgue.

Notación preliminar:

Para cualquier función de valor real $F$ en un intervalo $I$ , denótese por $\mu_F$ la medida de Lebesgue-Stieltjes generada por $F$ Así que $\mu_F\big((a,b]\big)=F(b)-F(a)$ para todos $[a,b]\subset I$ .

  • Recall que para cualquier función de valor real $F$ , $G$ de variación local finita en algún intervalo $I$ $$ \int_{(a,b]} F(t)\,\mu_G(dt)=F(b)G(b)-F(a)G(a)-\int_{(a,b]}G(t-)\,\mu_F(dt) $$ para todos $[a,b]\subset I$ . Esta fórmula se puede denotar como $$ d(FG)=F\,dG+ G_-\,dF $$ donde $G_-(t):=G(t-)$ y $dF(x):=\mu_F(dx)$ Es decir $dF\big((a,b]\big)=F(b)-F(a)$ .

  • Si $G$ es una función continua de variación localmente finita, entonces $$ dG^n = n G^{n-1}(t)\,dG$$ Esto se puede demostrar por inducción. Para $n=1$ es válido. Para $n\geq1$ $$ d(G^{n+1})=d(G^n\,G)=G\,dG^n + G^n\,dG=nG^n\,dG+ G^n\,dG=(n+1) G^n\,dG$$ A partir de esto, obtenemos la conocida fórmula exponencial para medidas continuas: $$\begin{align} d e^G(t) = e^{G(t)}\,dG(t):= e^{G(t)}\,d\mu_G(dt)\tag{3}\label{exp-for1} \end{align} $$

Un resultado técnico:

Lema: Supongamos que $G$ es continua y no decreciente en el intervalo $[0,T)$ $(0<T\leq\infty)$ . Entonces, para cualquier $n\in\mathbb{N}$ $$ \int_{(0,t]}G^{n-1}(s-)\mu_G(ds)\leq \frac{G^n(t)-G^n(0)}{n}\leq\int_{(0,t]}G^{n-1}(s)\mu_G(ds) $$ para todos $0<t<T$ . (En notación diferencial, $nG^{n-1}_-dG\leq dG^n\leq nG^{n-1}dG$ .)

He aquí una breve prueba :

Para $n\in\mathbb{N}$ , $G^n$ es continua y no decreciente, por lo que la medida asociada de Lebesgue-Stieltjes $\mu_{G^n}$ no es negativo. La aplicación repetida de la integración por partes da $$ \begin{align} dG^n &= G^{n-1}_-\,dG + G\,dG^{n-1}=G^{n-1}_-\,dG + G (G^{n-2}_-\,dG + G\,dG^{n-2})\\ &= (G^{n-1}_-+GG^{n-2}_- +\ldots + G^{n-1})\,dG \end{align} $$ en notación diferencial. Como $G(s-)\leq G(s)$ para todos $0<s\leq T$ concluimos que $$ n G^{n-1}_-\,dG \leq dG^n\leq n G^{n-1}\,dG $$

Prueba del teorema principal:

Como $v\in \mathcal{L}^{loc}_1(\mu_F)$ , $v\in\mathcal{L}^{loc}_1(\mu_{F_I})$ y así $$ \|v\mathbb{1}_{(0,t]}\|_{\mathcal{L}_1(\mu_{F_I})}=\sum_{0<x_j\leq t}|v(x_j)|\Delta F(x_j)<\infty. $$ En consecuencia, $H$ está acotado en cada subintervalo compacto de $[0,\infty)$ . Sea $$ \begin{align} G_1(t)&=H_0\prod_{0<x_j\leq t}(1+v(x_j)\Delta F(x_j))\\ G_2(t)&=\exp\Big(\int_{(0,t]}v(x)\mu_{F_c}(dx)\Big). \end{align} $$ $G_1$ es una función de salto pura y continua de variación acotada que cambia sólo en $x_j$ Además, $$ \begin{align} \Delta G_1(x_j)=G(x_j)-G(x_j-)&=G(x_j-)\big(1+v(x_j)\Delta F(x_j)\big)-G(x_j-)\\ &= G(x_j-)v(x_j)\Delta F(x_j). \end{align} $$ $G_2$ es una función continua monótona no decreciente y $$ \begin{align} \mu_{G_2}(dx)&=\exp\Big(\int_{(0,x]}v(y)\mu_{F_c}(dy)\Big)v(x)\mu_{F_c}(dx)\\ &= G_2(x)v(x)\mu_{F_c}(dx). \end{align} $$ Aplicando la fórmula de integración por partes a $H(t)=G_1(t)G_2(t)$ da $$ \begin{align} H(t)-H(0)&=\int_{(0,t]}G_1(x-)\mu_{G_2}(dx)+\int_{(0,t]}G_2(x)\mu_{G_1}(dx)\\ &= \int_{(0,t]}G_1(x-)G_2(x)v(x)\mu_{F_c}(dx)+ \sum_{0<x_j\leq t}G_2(x_j)G_1(x_j-)v(x_j)\Delta F(x_j)\\ &= \int_{(0,t]}H(x-)v(x)\mu_{F_c}(dx)+\int_{(0,t]}H(x-)v(x)\mu_{F_I}(dx)\\ &=\int_{(0,t]}H(x-)v(x)\mu_F(dx). \end{align} $$ Queda por demostrar la unicidad. Supongamos que $H_1$ y $H_2$ son dos soluciones y se establece $D=H_1-H_2$ . Sea $M:=\|D\mathbb{1}_{(0,t]}\|_u$ y $\Lambda(t)=\int_{(0,t]}|v(x)|\mu_F(dx)$ . Entonces, $$ |D(t)|\leq \int_{(0,t]}|D(x-)||v(x)|\mu_F(dx)\leq M\int_{(0,t]}|v(x)|\mu_{F}(dx) = M\Lambda(t). $$ Como $\Lambda$ es no decreciente y continua por la derecha, $|D(x-)| \leq M\Lambda(x-)$ . Según el lema técnico anterior $$ \begin{align} |D(t)|&\leq M\int_{(0,t]}\Lambda(x-) |v(x)|\mu_F(dx) = M\int_{(0,t]}\Lambda(x-)\mu_\Lambda(dx)\leq \frac{M}{2} \Lambda^2(t). \end{align} $$ Continuando por inducción obtenemos $|D(t)|\leq \frac{M}{n!}\Lambda^n(t)$ . Dejar $n\rightarrow\infty$ da $|D(t)|=0$ .

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X