Tengo un conjunto de datos con 4 cohortes de aproximadamente el mismo tamaño (~700 personas cada una). Estoy intentando aplicar un modelo PH de Cox utilizando el tiempo necesario para aprobar un examen muy difícil como mi variable "tiempo". Las cohortes difieren porque son clases diferentes (clase de 2009, clase de 2010, 2011 y 2012). Estos son claramente también el momento en que entran en el estudio.
Todos los tiempos están censurados desde 2013. ¿Hay alguna manera de tener en cuenta el hecho de que el "tiempo de estudio" es diferente para cada cohorte? Estaba pensando en estratificar por cohortes, pero los coeficientes serían claramente negativos y disminuirían cada vez más rápido. Sin embargo, esto se debería no a una disminución real del peligro, sino al hecho de que las últimas cohortes son objeto de seguimiento durante menos tiempo.
Para aclarar mi último punto, incluiré un código que acabo de ejecutar en R.
¡Código R! http://i58.tinypic.com/25txbfa.jpg
cox2 <- coxph(ml ~ as.factor(Cohort), data = data)
summary(cox2)
# Call:
# coxph(formula = m1 ~ as.factor(Cohort), data = data)
# n= 1865, number of events= 621
# (63237 observations deleted due to missingness)
#
# coef exp(coef) se(coef) z Pr(>lzl)
# as.factor(Cohort)2010 -0.23715 0.78887 0.09601 -2.470 0.01351 *
# as.factor(Cohort)2011 -0.35811 0.69899 0.12345 -2.901 0.00372 **
# as.factor(Cohort)2012 -0.76813 0.46388 0.17111 -4.489 7.15e-06 ***
# ---
# Signif. codes: 0 ‘***' 0.001 ‘**' 0.01 ‘*' 0.05 ‘.' 0.1 ‘ ' 1
#
# exp(coef) exp(-coef) lower .95 upper .95
# as.factor(Cohort)2010 0.7889 1.268 0.6536 0.9522
# as.factor(Cohort)2011 0.6990 1.431 0.5488 0.8903
# as.factor(Cohort)2012 0.4639 2.156 0.3317 0.6487
#
# Concordance= 0.568 (se = 0.012 )
# Rsquare= 0.013 (max possible= 0.99 )
# Likelihood ratio test= 24.5 on 3 df, p=1.968e-05
# Wald test = 23.31 on 3 df, p=3.482e-05
# Score (logrank) test = 23.85 on 3 df, p=2.683e-05
Como esperaba, los coeficientes son todos negativos y disminuyen rápidamente. Estoy seguro de que esto se debe no a una disminución real del peligro, sino al hecho de que los tiempos de seguimiento de cada cohorte disminuyen a medida que aumenta la covariable de clase.