Este es un problema que me ha atormentado durante mucho tiempo y no he encontrado buenas respuestas en los libros de texto, Google o Stack Exchange.
Dispongo de un conjunto de datos de más de 100.000 pacientes para los que se comparan cuatro tratamientos. La pregunta de investigación es si la supervivencia es diferente entre estos tratamientos después de ajustar por un grupo de variables clínicas/demográficas. A continuación se muestra la curva KM sin ajustar.
Todos los métodos que utilicé indicaban la existencia de riesgos no proporcionales (por ejemplo, curvas de supervivencia log-log sin ajustar, así como interacciones con el tiempo y la correlación de los residuos de Schoenfield y el tiempo de supervivencia clasificado, que se basaban en modelos ajustados de Cox PH). A continuación se muestra la curva de supervivencia log-log. Como puede verse, la forma de no proporcionalidad es un desastre. Aunque ninguna de las comparaciones de dos grupos sería demasiado difícil de manejar de forma aislada, el hecho de que tengo seis comparaciones es realmente me desconcierta. Mi conjetura es que no voy a ser capaz de manejar todo en un modelo.
Busco recomendaciones sobre qué hacer con estos datos. Modelizar estos efectos utilizando un modelo de Cox ampliado es probablemente imposible dado el número de comparaciones y las diferentes formas de no proporcionalidad. Dado que están interesados en las diferencias de tratamiento, un modelo estratificado global no es una opción porque no me permitirá estimar estas diferencias.
Así que, siéntase libre de destrozarme, pero estaba pensando en estimar inicialmente un modelo estratificado para obtener los efectos de las otras covariables (probando el supuesto de no interacción, por supuesto), y luego volver a estimar modelos de Cox multivariables separados para cada comparación de dos grupos (por lo tanto, 6 modelos en total). De esta forma, puedo abordar la forma de no proporcionalidad para cada comparación de dos grupos y obtener una estimación de HR menos errónea. Entiendo que los errores estándar estarían sesgados, pero dado el tamaño de la muestra, es probable que todo sea "estadísticamente" significativo.
0 votos
¿Ha intentado ajustar las variables clínicas/demográficas con puntuaciones de propensión en lugar de la regresión de Cox? Con esta abundancia de datos, el ajuste por puntuaciones de propensión podría ser factible.
0 votos
@EdM No para estos datos. Mi incertidumbre con respecto a cómo hacer coincidir exactamente la puntuación de propensión con datos de categorías múltiples (es decir, >2 categorías) me ha impedido probar este método. Sin embargo, en mi experiencia, los resultados del análisis multivariable serán muy similares a los resultados del análisis de propensity score matched (dado que el propósito de ambos es abordar el sesgo de selección). Por lo tanto, sospecharía que acabaría con el mismo problema de no proporcionalidad.
0 votos
Esto se refiere a la confusión, no a la heterogeneidad de los resultados.