Estoy empezando a configurar un análisis de supervivencia en R. Eché un vistazo en este libro aquí: https://www.powells.com/book/modeling-survival-data-9780387987842/ pero luchan por configurar correctamente los datos en primer lugar. Así que esta es una pregunta muy básica para el análisis de supervivencia, ya que no puedo encontrar un buen ejemplo en línea. Si hay algún ejemplo que responda a mi pregunta, ¡agradecería que me enviaran un enlace!
#Survival analysis data set
ID<-c(2,3,1,2,3,1,2,3,1,3)
year<-c(1999,1999,2000,2000,2000,2001,2001,2001,2002,2002)
'simply random numbers 1-5 where 5 is the event'
x1<-c(4,3,2,1,4,5,3,2,1,5)
'x2 event dummy'
event<-ifelse(x1==5,1,0)
df<-data.frame(ID,year,x1,event)
df
Por lo que he leído entiendo que tiene que haber un tiempo de censura. Pero, ¿cuál es exactamente?
¿Este tiempo de censura es el tiempo transcurrido desde el inicio de la observación? ¿O sólo si la observación específica abandonó la muestra? Es decir
'Censoring time'
C1<-c(0,0,0,1,1,1,2,2,2,3)
C2<-c(rep(0,6),1,0,0,0)
df<-data.frame(ID,year,x1,event,C1,C2)
df
¿Cómo tratar las observaciones en las que se ha producido el suceso, pero los datos siguen estando disponibles? Por ejemplo en:
df[6,]
ID year x1 event C
1 2001 5 1 2
Por último, tiene que haber una variable "tiempo hasta el evento" o fin del estudio como la siguiente:
'Time to event/ end of study:'
t<-c(2,3,1,1,2,0,0,1,0,0)
df<-data.frame(ID,year,x1,event,C1,C2,t)
df
Agradezco cualquier idea, sugerencia, enlace, etc.