En R, estoy haciendo análisis de datos de supervivencia de pacientes con cáncer.
He estado leyendo cosas muy útiles sobre análisis de supervivencia en CrossValidated y otros sitios y creo que he entendido cómo interpretar los resultados de la regresión de Cox. Sin embargo, un resultado todavía me molesta...
Estoy comparando la supervivencia en función del sexo. Las curvas de Kaplan-Meier favorecen claramente a los pacientes de sexo femenino (he comprobado varias veces que la leyenda que he añadido es correcta, el paciente con la máxima supervivencia, 4856 días, es efectivamente una mujer):
Y vuelve la regresión de Cox:
Call:
coxph(formula = survival ~ gender, data = Clinical)
n= 348, number of events= 154
coef exp(coef) se(coef) z Pr(>|z|)
gendermale -0.3707 0.6903 0.1758 -2.109 0.035 *
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
exp(coef) exp(-coef) lower .95 upper .95
gendermale 0.6903 1.449 0.4891 0.9742
Concordance= 0.555 (se = 0.019 )
Rsquare= 0.012 (max possible= 0.989 )
Likelihood ratio test= 4.23 on 1 df, p=0.03982
Wald test = 4.45 on 1 df, p=0.03499
Score (logrank) test = 4.5 on 1 df, p=0.03396
Así pues, la razón de riesgos (HR) para los pacientes varones ( gendermale
) es 0,6903. La forma en que yo lo interpretaría (sin mirar la curva de Kaplan-Meier) es: como el HR es <1, ser un paciente de sexo masculino es protector. O más exactamente, una paciente de sexo femenino tiene 1/0,6903 = exp(-coef) = 1,449 más probabilidades de morir en un momento determinado que un varón.
Pero eso no parece ser lo que dicen las curvas de Kaplan-Meier. ¿Qué hay de malo en mi interpretación?
3 votos
A partir de su curva K-M, parece que el supuesto PH de la regresión de Cox no se cumple.
0 votos
Ya veo. No lo había mirado antes. Gráficamente, significa que mis curvas de Kaplan-Meier deberían ser paralelas, por lo que puedo utilizar Cox con seguridad, ¿verdad? Eso parece más o menos bien antes de ~ 2200 días. ¿Está bien echar un vistazo a los resultados de Cox para todos los datos un poco antes de la intersección?
4 votos
NB Son las curvas $\log -\log \hat S_i(t)$ donde $\hat S_i(t)$ es la función de supervivencia estimada para el grupo $i$ que deberían ser paralelas bajo riesgos proporcionales. Como señala @IWS, los intervalos de confianza serán muy amplios para el grupo femenino después de unos 3000 días (¿sólo hay dos que superen ese punto?), por lo que la hipótesis PH mayo no estar tan mal.
0 votos
@DeepNorth: La verdad es que no veo pruebas contundentes en contra de los riesgos proporcionales. Sí, las curvas técnicamente se superponen... pero eso es en las colas extremas.
0 votos
Como complemento a las demás respuestas y comentarios, compare la mediana de supervivencia o supervivencia a cinco años de los hombres y de las mujeres. Hay un claro beneficio para los varones en estos datos, de acuerdo con el análisis PH de Cox.