La configuración de proceso de conteo estándar utilizada para manejar valores de covariables variables en el tiempo funciona aquí en principio, ya que también representa tiempos de inicio truncados a la izquierda con eventos o censura a la derecha al final del período de tiempo. Es decir, con la construcción Surv(tiempoInicio,tiempoFin,estado)
, el tiempoInicio
se considera truncado a la izquierda y estado
representa un evento o censura en tiempoFin
.
However, I'm not sure that's a good idea in your case, however.
Primero, cuando utilizas el nacimiento como tiempo = 0
y tienes tiempos de supervivencia truncados a la izquierda, puedes obtener resultados muy extraños. A diferencia de un modelo de supervivencia más típico con todos en riesgo en tiempo = 0
, solo aquellos con las fechas de entrada más tempranas están en riesgo en los tiempos de evento más tempranos. Incluso es posible que las curvas de supervivencia caigan a 0 si esos casos de entrada temprana tienen eventos antes de que otros ingresen al conjunto de riesgo en edades posteriores. Ver la Sección 4.6 de Klein and Moeschberger. Ellos sugieren:
En lugar de estimar la función de supervivencia incondicional, estimamos la probabilidad condicional de sobrevivir más allá de la edad t, dada la supervivencia hasta la edad a.
Una alternativa que tiendo a preferir sería utilizar la edad de inclusión como covariable (modelada de forma flexible con un spline de regresión) y usar el tiempo desde la inclusión como su tiempo hasta el evento o censura a la derecha. Si la inclusión se basó en un diagnóstico clínico de la enfermedad cerca del momento de inclusión, eso tendría sentido. Por ejemplo, así es como se maneja típicamente la edad en estudios de supervivencia del cáncer. Deberá aplicar su comprensión del tema para decidir si eso tiene sentido para usted.
Segundo, si solo tiene 5 tiempos de seguimiento entonces un modelo de Cox asumiendo tiempo continuo probablemente no sea una elección sabia. Si la evaluación del evento de "disminución de la capacidad" se realiza solo en los tiempos de seguimiento, entonces sus tiempos de evento están intervalo censurados: solo tiene límites inferior y superior para el tiempo transcurrido real desde tiempo = 0
hasta el evento.
Si los 5 intervalos de seguimiento son los mismos para todos los individuos (por ejemplo, cada 6 meses), podría utilizar un modelo de supervivencia de tiempo discreto, que es esencialmente un conjunto de regresiones binarias. Con sus datos emparejados, eso podría hacerse a través de un conjunto de regresiones logísticas condicionales (que terminan siendo resueltas con rutinas de supervivencia de Cox para datos estratificados a través de la función clogit()
), pero no he pensado en eso con cuidado.
De lo contrario, necesitaría usar un modelo que maneje datos de supervivencia censurados por intervalos. La función survreg()
estándar de R puede manejar la censura por intervalos en un modelo de supervivencia paramétrico. El paquete icenReg
de R proporciona formas adicionales de manejar la censura por intervalos, aunque no estoy seguro de cómo maneja cosas como sus clústeres. El vignette del paquete explica claramente la censura por intervalos y muestra ejemplos; el autor del paquete también visita este sitio.
Tercero, considere si designar un evento de "disminución de la capacidad" todo o nada es la mejor manera de proceder. La "disminución de la capacidad" es típicamente un proceso graduado con el tiempo. Modelar una medida cuantitativa de "capacidad" a lo largo del tiempo podría ser mucho más potente e informativo.