2 votos

¿Cómo mostrar un gráfico de Kaplan-Meier (gráfico de supervivencia) con cientos de miles de puntos de datos?

Hice una biblioteca para mostrar gráficos de supervivencia. Actualmente estoy luchando para averiguar cómo mostrar de manera significativa los datos con 300.000 puntos de datos. Parece que no hay suficientes píxeles en el área del gráfico.

¿Tendría sentido hacer algo así como "más puntos de interés para más personas que caen en el mismo día"?

2voto

Sean Hanley Puntos 2428

En general, las marcas en un gráfico de Kaplan-Meier sirven para indicar censurado observaciones, no más eventos al mismo tiempo. Sin embargo, es habitual que tenga la opción de desactivar los ticks (es decir, no mostrarlos). En lugar de tener ticks más altos para más observaciones censuradas en un momento dado, yo simplemente haría que no se mostraran por defecto cuando N es grande. Por otro lado, los intervalos de confianza asintóticos deberían ser muy fiables cuando se tiene N muy grande. Tener la curva con el intervalo de confianza me parece que transmite la información útil de forma más eficaz que intentar representar las censuras. Por lo tanto, cuando N es grande, yo prefiero que la curva se sitúe sobre un fondo sombreado que represente la banda de confianza. He aquí un ejemplo, copiado de aquí (Aunque puede que no lo haga rojo):

enter image description here

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X