53 votos

Predicción en la regresión de Cox

Estoy haciendo una regresión multivariante de Cox, tengo mis variables independientes significativas y los valores beta. El modelo se ajusta muy bien a mis datos.

Ahora, me gustaría utilizar mi modelo y predecir la supervivencia de una nueva observación. No tengo claro cómo hacerlo con un modelo de Cox. En una regresión lineal o logística, sería fácil, sólo hay que poner los valores de la nueva observación en la regresión y multiplicarlos por betas y así tengo la predicción de mi resultado.

¿Cómo puedo determinar mi riesgo de referencia? Lo necesito además de calcular la predicción.

¿Cómo se hace esto en un modelo de Cox?

42voto

ocram Puntos 9992

Siguiendo el modelo de Cox, el riesgo estimado para el individuo $i$ con el vector de covariables $x_i$ tiene la forma $$\hat{h}_i(t) = \hat{h}_0(t) \exp(x_i' \hat{\beta}),$$ donde $\hat{\beta}$ se obtiene maximizando la probabilidad parcial, mientras que $\hat{h}_0$ se deduce del estimador de Nelson-Aalen, $$ \hat{h}_0(t_i) = \frac{d_i}{\sum_{j:t_j \geq t_i} \exp(x_j' \hat{\beta})} $$ con $t_1$ , $t_2, \dotsc$ los distintos tiempos de los acontecimientos y $d_i$ el número de muertes en $t_i$ (véase, por ejemplo Apartado 3.6 ).

Del mismo modo, $$\hat{S}_i(t) = \hat{S}_0(t)^{\exp(x_i' \hat{\beta})}$$ con $\hat{S}_0(t) = \exp(- \hat{\Lambda}_0(t))$ y $$\hat{\Lambda}_0(t) = \sum_{j:t_j \leq t} \hat{h}_0(t_j).$$

EDITAR: Este también puede ser de interés :-)

0 votos

Tal vez debería formular mi pregunta de otra manera. Lo que busco es la forma de predecir un resultado en el modelo de Cox. Para mi análisis de supervivencia, utilicé un enfoque de riesgos proporcionales de Cox. Obtuve una lista de factores sig. para mi resultado y ahora me gustaría utilizar mi modelo para predecir la supervivencia de una nueva observación. ¿Necesito estimar el riesgo basal? ¿Cómo puedo predecir mi supervivencia?

0 votos

El análisis de supervivencia no suele utilizarse para predecir los tiempos futuros de un suceso. Podría haber varias formas de hacerlo, por ejemplo aplicando la mediana del tiempo de supervivencia o la media del tiempo de supervivencia, por poner dos ejemplos. Pero las propiedades de la curva de supervivencia que usted necesita requerirían una curva de supervivencia estimada que, para el modelo de Cox, requeriría la especificación de la función de riesgo basal (que no se proporciona en el enfoque de Cox).

0 votos

@Marjan al decir que obtuviste una lista de factores "significativos" das a entender que utilizaste una selección de variables que puede dar lugar a predicciones poco fiables. Puede que merezca la pena realizar una validación bootstrap, repitiendo todos los pasos de selección de variables para, digamos, 300 remuestreos.

15voto

RobW Puntos 1798

La función predictSurvProb en el pec puede proporcionarle estimaciones de riesgo absoluto para nuevos datos basados en un modelo Cox existente si utiliza R.

Los detalles matemáticos no puedo explicarlos.

EDIT: La función proporciona probabilidades de supervivencia, que hasta ahora he tomado como 1-(Probabilidad de suceso).

EDITAR 2:

Se puede prescindir del paquete pec. Utilizando sólo el paquete de supervivencia, la siguiente función devuelve el riesgo absoluto basado en un modelo de Cox

risk = function(model, newdata, time) {
  as.numeric(1-summary(survfit(model, newdata = newdata, se.fit = F, conf.int = F), times = time)$surv)
}

0 votos

1-La probabilidad de supervivencia es el riesgo acumulado. Creo que el PO solicita la función de peligro instantánea (de la línea de base) o algún tipo de estimación suavizada de la misma ( muhaz paquetes en R).

1 votos

1-La probabilidad de supervivencia no es el riesgo acumulado. En ausencia de riesgos concurrentes, ambas están conectadas, como se detalla en es.wikipedia.org/wiki/ .

0 votos

1-Probabilidad de supervivencia = Tasa de fallos (suponiendo sólo 1 método de fallo). La relación entre la probabilidad de supervivencia y el riesgo acumulado se describe en la respuesta aceptada: S(t)=exp((t)) donde (t) es el peligro acumulado.

15voto

DuckMaestro Puntos 151

¿Quizá a usted también le gustaría probar algo así? Ajuste un modelo de riesgos proporcionales de Cox y utilícelo para obtener la curva de supervivencia prevista para un nuevo caso.

Extraído del archivo de ayuda de survfit.coxph en R (acabo de añadir la parte de las líneas)

# fit a Cox proportional hazards model and plot the  
# predicted survival for a 60 year old 
fit <- coxph(Surv(futime, fustat) ~ age, data=ovarian) 
plot(survfit(fit, newdata=data.frame(age=60)),
     xscale=365.25, xlab="Years", ylab="Survival", conf.int=F) 
# also plot the predicted survival for a 70 year old
lines(survfit(fit, newdata=data.frame(age=70)),
     xscale=365.25, xlab="Years", ylab="Survival") 

Sin embargo, debe tener en cuenta que para que la hipótesis de riesgos proporcionales siga siendo válida para su predicción, el paciente para el que realiza la predicción debe pertenecer a un grupo que sea cualitativamente el mismo que el utilizado para derivar el modelo de riesgos proporcionales de Cox que utilizó para la predicción.

7voto

frglps Puntos 521

Les basehaz función de survival proporciona el peligro de referencia en los puntos temporales del suceso. A partir de ahí, puede utilizar las matemáticas que proporciona ocram e incluir las OR de sus estimaciones coxph.

2voto

mat_geek Puntos 1367

La razón de ser del modelo de Cox es el supuesto de riesgo proporcional y el uso de la probabilidad parcial. La probabilidad parcial elimina la función de riesgo basal. Por lo tanto, no es necesario especificar una. ¡Eso es lo bueno!

3 votos

Sin embargo, si desea obtener una estimación del riesgo o la supervivencia para un valor concreto del vector de covariables, necesitará una estimación del riesgo o la supervivencia de referencia. La estimación de Nelson-Aalen suele hacer el trabajo...

2 votos

A menudo, con el modelo de Cox se comparan dos funciones de supervivencia y la clave es el cociente de riesgos en lugar de la función de riesgos. El riesgo basal es como un parámetro molesto que Cox eliminó inteligentemente del problema utilizando el supuesto de riesgos proporcionales. Cualquiera que sea el método que desee utilizar para estimar la función de riesgo y/o el riesgo basal en el contexto del modelo, requerirá utilizar la forma Cox del modelo que fuerza la proporcionalidad.

0 votos

Muchas gracias, Seria genial que vieras mi comentario en la respuesta de ocram. ¿Tal vez usted podría ayudarme también?

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X