2 votos

Configuración de datos para el análisis de supervivencia en R

Estoy empezando a configurar un análisis de supervivencia en R. Eché un vistazo en este libro aquí: https://www.powells.com/book/modeling-survival-data-9780387987842/ pero luchan por configurar correctamente los datos en primer lugar. Así que esta es una pregunta muy básica para el análisis de supervivencia, ya que no puedo encontrar un buen ejemplo en línea. Si hay algún ejemplo que responda a mi pregunta, ¡agradecería que me enviaran un enlace!

#Survival analysis data set

ID<-c(2,3,1,2,3,1,2,3,1,3)
year<-c(1999,1999,2000,2000,2000,2001,2001,2001,2002,2002)
'simply random numbers 1-5 where 5 is the event'
x1<-c(4,3,2,1,4,5,3,2,1,5)
'x2 event dummy'
event<-ifelse(x1==5,1,0)

df<-data.frame(ID,year,x1,event)
df

Por lo que he leído entiendo que tiene que haber un tiempo de censura. Pero, ¿cuál es exactamente?

¿Este tiempo de censura es el tiempo transcurrido desde el inicio de la observación? ¿O sólo si la observación específica abandonó la muestra? Es decir

'Censoring time'
C1<-c(0,0,0,1,1,1,2,2,2,3)
C2<-c(rep(0,6),1,0,0,0)
df<-data.frame(ID,year,x1,event,C1,C2)
df

¿Cómo tratar las observaciones en las que se ha producido el suceso, pero los datos siguen estando disponibles? Por ejemplo en:

df[6,]
ID year x1 event C
1 2001  5     1  2

Por último, tiene que haber una variable "tiempo hasta el evento" o fin del estudio como la siguiente:

'Time to event/ end of study:'
t<-c(2,3,1,1,2,0,0,1,0,0)
df<-data.frame(ID,year,x1,event,C1,C2,t)
df

Agradezco cualquier idea, sugerencia, enlace, etc.

2voto

alexs77 Puntos 36

El tiempo de censura no es un requisito. En las pruebas de fiabilidad de motores, por ejemplo, todos los motores suelen someterse a tensión hasta que explotan. Pero en el caso de los pacientes con cáncer, es posible que no hayan sufrido el evento en el momento del análisis o que se hayan perdido durante el seguimiento.

Un momento de censura es el último momento del estudio de cohortes en el que se sabía que el sujeto corría el riesgo de sufrir el acontecimiento. Por este motivo, nunca conocemos el momento del acontecimiento cuando hay censura (salvo que debe haber pasado un determinado momento).

En un objeto SURV en R, el tiempo de "evento" es el mínimo del tiempo de evento y el tiempo de censura.. una construcción puramente probabilística para describir los datos que REALMENTE se obtienen. Para designar si ese tiempo fue un evento real, o una censura, se utiliza el indicador de evento como segundo argumento del SURV.

Así, por ejemplo:

t <- c(10, 20)
i <- c(1, 0)
Surv(t, i)

Crea un objeto superviviente para 1 suceso de muerte en el tiempo 10 y 1 suceso de censura en el tiempo 20.

Por defecto, se trata de la censura izquierda porque es el tipo de censura más común. Si hay censura derecha ("tiempo transcurrido desde el inicio de la observación"), puede introducir un tiempo 1 y un tiempo 2 en el objeto superviviente, donde el tiempo 1 designa la entrada en el conjunto de riesgo. También existen métodos para la censura por intervalos.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X