El modelo de Cox no depende de los tiempos en sí, sino que sólo necesita una ordenación de los acontecimientos. ¿Cómo es que no necesita el tiempo, ya que todos los modelos que he visto hasta ahora dependen del punto temporal y/o intervalo exactos?
Respuestas
¿Demasiados anuncios?Intuitivamente, los parámetros (estimados) del modelo son cocientes de riesgos. Son constantes a lo largo del tiempo. Por tanto, para cualquier función de riesgo "media" arbitraria (del tiempo), los cocientes de riesgo son todo lo que se necesita para describir la diferencia de riesgo entre grupos. El "intercepto" de un modelo de Cox es una función de riesgo basal, o una función de riesgo variable en el tiempo para individuos que tienen valores 0 para todos los parámetros.
Como en el caso de la inferencia semiparamétrica, nos gusta utilizar trucos ingeniosos para evitar la estimación de funciones tan complicadas como el riesgo base. La probabilidad parcial es un cociente de peligros entre los que fracasan y los que sobreviven en cada momento de fracaso: (individuos en el "conjunto de riesgo"). Si escribes los cálculos, verás que la función de riesgo base se anula y obtienes contribuciones de probabilidad parcial que no varían en función del tiempo.
La única pega de la información relativa a los tiempos es la especificación del conjunto de riesgos: por eso sólo importa la ordenación de los tiempos de los sucesos... esto es lo que obligó a Cox a llamarlo un parcial probabilidad y no una condicional probabilidad. Cuando se piensa en la interpretación de la $p$ -valor, consideras los tiempos de los eventos como dados, pero las permutaciones de qué individuos fallan cuándo es la única contribución a la "aleatoriedad" en la muestra.
La verosimilitud parcial se comporta de forma muy parecida a la verosimilitud normal y puede maximizarse para obtener estimaciones de los cocientes de riesgo variables en el tiempo.
El propio modelo de Cox depende del tiempo. De hecho, el modelo de Cox se escribe (utilizando notaciones estándar) $$ h(t) = h_0(t) \exp(x^\prime \beta) $$ La dependencia temporal se capta mediante la función de riesgo base $h_0(\cdot)$ . Típico del modelo de Cox es que $h_0(\cdot)$ no se especifica.
A partir de una muestra de datos de supervivencia $$ z=\big\{(y_j, \delta_j, x_j) \, \big|\, j = 1, \dotsc, N\big\} $$ donde $y_j$ es el mínimo entre el tiempo real del suceso y el tiempo de censura, $\delta_j$ es el indicador de sucesos ( $\delta_j = 1$ si la observación corresponde a un acontecimiento, y $\delta_j = 0$ si la observación está censurada a la derecha), y $x_j$ es el vector de covariables, la probabilidad de supervivencia es de la forma $$ L(h_0(\cdot), \beta;\, z) = \prod_{j=1}^N \big( h_0(y_j) \exp(x_j^\prime \beta) \big)^{\delta_j} \exp \big\{ -H_0(y_j) \exp(x_j^\prime \beta) \big\} $$ con $H_0(\cdot)$ la función de riesgo acumulativo.
Como vemos, la probabilidad de supervivencia depende de los tiempos de supervivencia (el $y_j$ 's).
Dado que la probabilidad de supervivencia implica el riesgo de base (no especificado), no puede utilizarse para la inferencia en el modelo de Cox. En su lugar, el modelo de Cox se ajusta basándose en una verosimilitud parcial dada por $$ L_p(\beta;\, z) = \prod_{j=1}^N \left( \frac{\exp(x_j^\prime \beta)}{\sum_{\ell \in R(y_j)} \exp(x_\ell^\prime \beta)} \right)^{\delta_j} $$ con $R(y_j)$ el riesgo fijado en el momento $y_j$ con todos los sujetos que seguían en observación justo antes de $y_j$ es decir $$ R(y_j) = \big\{ \ell \,\big|\, y_\ell \geq y_j \big\} $$
Como vemos, la probabilidad parcial depende de los tiempos de supervivencia sólo a través del conjunto de riesgos.
Ahora bien, si cambiamos los tiempos de supervivencia pero mantenemos idéntica la clasificación, esto no modificará los conjuntos de riesgo. En otras palabras, " el modelo de Cox no depende de los tiempos en sí, sino que sólo necesita una ordenación de los acontecimientos. "
0 votos
Su pregunta parece terminar a mitad de frase. ¿Ha perdido parte de ella?