Considere observaciones censuradas a la derecha, con eventos en tiempos $t_1, t_2, \dots$ . El número de individuos susceptibles en el momento $i$ es $n_i$ y el número de sucesos en el momento $i$ es $d_i$ .
El estimador de Kaplan-Meier o de producto surge de forma natural como MLE cuando la función de supervivencia es una función escalonada $S(t) = \prod_{i : t_i < t} \alpha_i$ . La probabilidad es entonces $$ L(\alpha) = \prod_i (1-\alpha_i)^{d_i} \alpha_i^{n_i-d_i} $$ y la MLE es $\widehat\alpha_i = 1 - {d_i\over n_i}$ .
Bien, ahora supongamos que quiero ser bayesiano. Necesito algún tipo de prior ``natural'' con el que multiplicaré $L(\alpha)$ ¿verdad?
Googleando las palabras clave obvias encontré que el proceso Dirichlet es un buen prior. Pero por lo que yo entiendo, es también un prior en los puntos de discontinuidad $t_i$ ?
Sin duda es muy interesante y estoy deseando conocerlo, sin embargo me conformaría con algo más sencillo. Empiezo a sospechar que no es tan fácil como pensaba al principio, y es hora de pediros consejo...
Muchas gracias de antemano.
PD: Algunas precisiones sobre lo que espero Me interesan las explicaciones (lo más sencillas posibles) sobre la forma de manejar la a priori del proceso Dirichlet, sin embargo creo que debería ser posible utilizar simplemente una a priori sobre la $\alpha_i$ - que es una prioridad sobre las funciones escalonadas con discontinuidades en $t_i$ .
Creo que la "forma global" de las funciones escalonadas muestreadas en la prior no debería depender de la $t_i$ debe haber una familia subyacente de funciones continuas que se aproximen mediante estas funciones escalonadas.
No sé si el $\alpha_i$ debería ser independiente (lo dudo). Si lo son, creo que esto implica que el anterior $\alpha_i$ depende de $\Delta t_i = t_i - t_{i-1}$ y si denotamos su distribución por $A(\Delta t)$ entonces el producto de a $A(\Delta_1)$ por una variable independiente $A(\Delta_2)$ es una variable $A(\Delta_1+\Delta_2)$ variable. Aquí parece que log- $\Gamma$ variables pueden ser útiles.
Pero aquí básicamente estoy atascado. No escribí esto al principio porque no quería dirigir todas las respuestas en esta dirección. Agradecería especialmente respuestas con referencias bibliográficas que me ayuden a justificar mi elección final.