23 votos

¿Cómo "tienen en cuenta la censura" los modelos de supervivencia? (¿Lo hacen?)

Fondo

Estoy dando una clase de introducción a la estadística en nuestro departamento de ciencias sociales y de la salud, y me estoy encontrando con algo que siempre había dado por sentado: a saber, la afirmación de que los métodos de análisis de supervivencia (desde Kaplan-Meier a los modelos de Cox) "tienen en cuenta" los datos censurados, y que ésta es una de las principales ventajas de estos métodos sobre otros enfoques.

(Antecedentes relevantes: en mi investigación utilizo, casi siempre torpemente, algunos métodos estadísticos y cuantitativos aplicados, y tengo un buen dominio e intuición para algunos de los conceptos básicos. Así que soy un generalista aceptable, pero no soy estadístico ni siquiera un estudiante de posgrado de estadística, ni mucho menos).

El problema

Sin embargo, mientras preparo algunas diapositivas de PowerPoint para estos estudiantes, me doy cuenta de que, si bien entiendo bastante bien lo que es la censura, no sé muy bien qué es la censura. es en métodos de supervivencia, no tengo ni idea cómo algo así como un modelo Cox "cuenta" para ello. Nunca había pensado en ello, y en su lugar asumí que esto es simplemente lo que sucedió. (Es posible que un profesor nos explicara esto en una etapa anterior de mi educación, pero también es posible que yo soliera tener dificultades en las clases de estadística de las 8 de la mañana).

Censurar, como todos ustedes ya saben, es el estado en el que tenemos algunos información sobre el tiempo de supervivencia individual, pero no conocemos exactamente el tiempo de supervivencia (Kleinbaum & Klein, p. 5; siempre me ha gustado esta explicación tan sencilla). En mi experiencia, a veces cuando los estadísticos intentan vender a alguien métodos de supervivencia, dicen cosas como "¡la regresión logística no tiene en cuenta la censura, pero la regresión de Cox sí!".

En CV hay artículos muy buenos sobre la censura; cette es quizá mi ejemplo favorito. En él, el usuario @Tim da una estupenda explicación de la censura:

Un ejemplo intuitivo de censura es preguntar a los encuestados por su edad, pero registrarla sólo hasta cierto valor y todas las edades por encima de este valor, digamos 60 años, se registran como "60+". De este modo, se dispone de información precisa sobre los valores no censurados y de ninguna información sobre los valores censurados.

Me parece brillante (de hecho, pienso tomarlo prestado durante la conferencia, con los créditos correspondientes, por supuesto). Sin embargo, no se profundiza en la forma en que los análisis de supervivencia abordan esta cuestión, y si se trata de un argumento de venta de los métodos de supervivencia ("nuestros métodos pueden hacer esto y los suyos no") o simplemente de algo que aparece cuando se plantean preguntas de supervivencia ("¿cuánto tiempo vivirá la gente, de media, después de recibir un tratamiento? X ?").

Las preguntas

  1. ¿Es cierto, estrictamente hablando, que algo como un estimador de Kaplan-Meier o un modelo de riesgos proporcionales de Cox está "contabilizando" la censura?

  2. Si es así, ¿cómo lo hace?

  3. Si un modelo de supervivencia tiene en cuenta la censura, ¿se trata de una "característica" de los métodos de supervivencia frente a otros, o de un "error", un artefacto inevitable del tipo de preguntas para las que se utilizan los métodos de supervivencia?

Mis conjeturas

Bueno, conjeturas no, más bien intuiciones muy poco claras de las que no me fío demasiado:

  1. ¿Por qué la censura es un problema? Creo que, si no se tiene en cuenta, la censura es una enorme fuente potencial de sesgo a la hora de hacer estimaciones de supervivencia: si no se sabe lo que ocurrió después de que el Sr. Smith abandonara el estudio (es decir, se perdió el seguimiento, es decir, fue censurado), las estimaciones pueden desviarse en una dirección u otra. Quizá vivió mucho, mucho tiempo, o quizá murió al día siguiente. Si esto le ocurre a muchas personas de la misma manera, sus estimaciones pueden ser muy, muy erróneas.

  2. Así que quizá lo que los modelos de supervivencia han encontrado es una forma de mantener en el análisis a todas las personas que contribuyeron al tiempo de supervivencia, independientemente de si conocemos o no su estado de resultado, mientras que otros métodos simplemente descartarían todos los datos de esas personas como perdidos.

¿Estoy muy, muy equivocado aquí?

19voto

Aaron Puntos 36

La censura se incorpora a los modelos de supervivencia incorporándola a la función de verosimilitud subyacente al análisis. La forma más común de censura se produce cuando observamos un elemento durante un periodo de tiempo finito $T$ y no falla en ese tiempo. A continuación le mostraré cómo se incorpora la censura en la función de verosimilitud y cómo afecta esto al modelo de riesgos proporcionales de Cox.


Incorporación de datos censurados a la función de verosimilitud: Como ejemplo común, supongamos que tenemos artículos en los que el tiempo hasta el fallo tiene una función de supervivencia $S$ y la función de densidad correspondiente $f$ , ambas parametrizadas por algún parámetro $\theta$ . Si un artículo $i$ se observa que falla en el momento $0 \leqslant t_i \leqslant T$ se incorpora a la función de verosimilitud mediante el término de densidad:

$$f(t_i | \theta).$$

Sin embargo, si un artículo $i$ se observa durante todo el tiempo $T$ y no falla, entonces se considera un punto de datos "censurado a la derecha" (sólo se sabe que falla en algún momento después de $G$ ) y se incorpora a la función de verosimilitud mediante el término de supervivencia:

$$S(T|\theta).$$

Supongamos que tenemos un modelo de supervivencia basado en la observación durante un período fijo de duración $T$ donde los tiempos hasta el fallo de cada observación son IID condicionales a algunos parámetros subyacentes. Sin pérdida de generalidad, tendremos $n$ fallos observados en ocasiones $t_1,...,t_n$ (todos dentro del intervalo $[0,T]$ ) y tendremos $m$ valores censurados a la derecha que no fallaron en el tiempo obervado $T$ . La función de verosimilitud global para estos datos viene dada entonces por:

$$L_\mathbf{t}(\theta) = \bigg( \prod_{i=1}^n f(t_i|\theta) \bigg) \times S(T|\theta)^m.$$

En esta función de verosimilitud puede verse que la censura de los datos está "incorporada" por el hecho de que los valores censurados a la derecha se incorporan a través de su función de supervivencia en lugar de la función de densidad para el tiempo hasta el fallo.


Ampliación al modelo de riesgos proporcionales de Cox: El modelo de riesgos proporcionales de Cox sigue utilizando una función de verosimilitud para los tiempos observados hasta el fallo y los tiempos de supervivencia, pero ahora añade covariables a los datos y utiliza un supuesto de riesgos proporcionales en la forma en que éstos se manifiestan en la función de riesgo. Esto no cambia el método subyacente de cómo los valores censurados se incorporan a la función de verosimilitud; por ejemplo, los valores censurados a la derecha siguen entrando a través de su función de supervivencia en lugar de la densidad del tiempo hasta el fallo.


Extensión a otros tipos de censura: Lo anterior muestra el caso común en el que tenemos observaciones censuradas a la derecha con el mismo tiempo de censura $T$ . Por supuesto, éste no es el único tipo de censura que puede producirse. Otra posibilidad es que observemos los artículos hasta diferentes tiempos finales, en cuyo caso los valores censurados a la derecha se producirían con diferentes periodos de observación $t_{n+1},...,t_{n+m}$ . En este caso, la función de verosimilitud se generalizaría a:

$$L_\mathbf{t}(\theta) = \bigg( \prod_{i=1}^n f(t_i|\theta) \bigg) \times \bigg( \prod_{i=1}^m S(t_{n+i}|\theta) \bigg).$$

Otra posibilidad (poco frecuente en el análisis de supervivencia) es la censura a la izquierda, en la que sabemos que un artículo no ha superado a más tardar el algún tiempo $T_i$ . Las observaciones censuradas a la izquierda entran en la función de verosimilitud a través de la función de distribución acumulativa $F$ . Si ampliamos nuestro modelo para suponer que tenemos $r$ observaciones censuradas a la izquierda con tiempos de observación $t_{n+m+i},...,t_{n+m+r}$ entonces la función de verosimilitud se generalizaría aún más a:

$$L_\mathbf{t}(\theta) = \bigg( \prod_{i=1}^n f(t_i|\theta) \bigg) \times \bigg( \prod_{i=1}^m S(t_{n+i}|\theta) \bigg) \times \bigg( \prod_{i=1}^r F(t_{n+m+i}|\theta) \bigg).$$

Y, por supuesto, puedes ampliar este evento para permitir tipos de censura más complicados. En general, si se sabe que una observación censurada cae en algún conjunto $\mathscr{A}$ entonces debería entrar en la función de verosimilitud a través del término de probabilidad:

$$\mathbb{P}(t_i \in \mathscr{A}|\theta) = \int \limits_\mathscr{A} f(t|\theta) \ dt.$$

9voto

EdM Puntos 5716

Algunos estudiantes podrían beneficiarse de la siguiente forma de representar la probabilidad parcial para un modelo de Cox, como ejemplo de la respuesta de Ben (+1) sobre la censura en general. Representar la verosimilitud parcial bajo el supuesto de riesgos proporcionales (sin tiempos de sucesos ligados) como sigue :

$$\prod_{i=1}^{n}\frac{h_0(t_i)\text{exp}(\beta X_i(t_i))}{\sum_{j\in\mathcal{R(t_i)}}h_0(t_i)\text{exp}(\beta X_j(t_i)))}= \prod_{i=1}^{n}\frac{\text{exp}(\beta X_i(t_i))}{\sum_{j\in\mathcal{R(t_i)}}\text{exp}(\beta X_j(t_i)))}$$

donde los casos con eventos están indexados por i y los horarios de sus eventos son $t_i$ los valores de las covariables son $X$ con los correspondientes coeficientes de regresión $\beta$ y el conjunto de riesgos a la vez $t_i$ , $\mathcal{R(t_i)}$ consta de todos casos $j$ en riesgo de un suceso en ese momento. El riesgo de referencia $h_0(t_i)$ factores fuera.

En puntuación de riesgo individual j a la vez $t_i$ en función de los valores de las covariables de ese individuo, es $\text{exp}(\beta X_j(t_i))$ . Este formulario hace hincapié en que el riesgo para el individuo i tener el suceso se compara efectivamente con los riesgos sumados de todos los individuos en riesgo en ese momento.

Así pues, la forma en que el modelo de Cox "tiene en cuenta la censura" es permitiendo que todos los individuos contribuyan a la probabilidad parcial, a través de sus puntuaciones de riesgo en el denominador, siempre que estén en riesgo de sufrir un suceso. No importa si los que están en el conjunto de riesgo tienen un evento en un momento posterior; proporcionan información mientras estén en riesgo y se omiten del análisis posterior. Se puede pensar que esto está relacionado con la contribución de la función de supervivencia que describe Ben. El producto global, sin embargo, es sólo sobre los individuos que tienen eventos; eso está relacionado con la contribución de la función de densidad que Ben describe.

También puede haber truncado en lugar de censurados. Así es, por ejemplo, como pueden configurarse los modelos con valores de covariables variables en el tiempo: truncados a la izquierda antes de que el nuevo valor de la covariable surta efecto, con censura a la derecha o un evento a partir de entonces. Las contribuciones de los tiempos de supervivencia truncados a la verosimilitud también pueden expresarse en términos de las funciones de densidad y supervivencia; esta página presenta dichas contribuciones tal como las describe Klein y Moeschberger .

Una advertencia: tanto mis respuestas como las de Ben suponen implícitamente que la censura no es informativa; es decir, que el hecho de censurar no proporciona ninguna información sobre la supervivencia, excepto que la supervivencia fue mayor que el tiempo observado de censura. No siempre es una suposición segura. La revisión de Leung et al sobre " Cuestiones de censura en el análisis de supervivencia Annu Rev Public Health 18:83-104 (1997) explica e ilustra esas consideraciones adicionales.

5voto

Alex Puntos 7652

He pensado responder directamente a las preguntas concretas anteriores: se trata de abordar las cuestiones conceptuales de primer nivel con algunas reflexiones sobre la enseñanza a este tipo de público, más que de una explicación técnica.


Las preguntas

1. ¿Es cierto, estrictamente hablando, que algo como un estimador de Kaplan-Meier o un modelo de riesgos proporcionales de Cox está "teniendo en cuenta" la censura?

¡Sí!


2. Si es así, ¿cómo lo hace?

Consulte otras respuestas para obtener detalles técnicos sobre cómo implementarlo para un modelo PH de Cox.

Creo que la intuición es más clara en el caso de la estimación de Kaplan-Meier y, según mi experiencia (cursos breves de enseñanza de estos métodos a investigadores/analistas en el ámbito de las ciencias de la salud), es razonablemente asequible para el tipo de público al que te diriges o, al menos, un buen punto de partida.

(Entiendo que esta pregunta es tanto para su propia comprensión como para saber qué o cómo enseñar a sus alumnos).

Esto se aplica tanto para la visualización ("incluido en el denominador hasta el punto del suceso/censura" con la x marcando el punto de la curva de supervivencia) como para el cálculo (mostrando cómo calculamos la supervivencia acumulada multiplicando la supervivencia acumulada del intervalo anterior por la supervivencia del intervalo actual en el conjunto de individuos en riesgo).


3. Si un modelo de supervivencia tiene en cuenta la censura, ¿se trata de una "característica" de los métodos de supervivencia frente a otros, o de un "error", un artefacto inevitable del tipo de preguntas para las que se utilizan los métodos de supervivencia?

En gran medida por diseño: estos métodos se desarrollaron para abordar los problemas que surgen cuando se censuran los tiempos de supervivencia (y para maximizar la eficacia, véase más abajo).


4. ¿Por qué la censura es un problema? Estoy pensando que, si se ignora, la censura es una enorme fuente potencial de sesgo a la hora de hacer estimaciones de supervivencia: si no se sabe qué ocurrió después de que el Sr. Smith abandonara el estudio (es decir, se perdió el seguimiento, es decir, fue censurado), las estimaciones pueden estar desviadas en una dirección u otra. [snip]

Si los datos temporales están sujetos a censura, pero no se ha tenido en cuenta en el análisis, los resultados estarán sesgados. En algunos casos (ya que hay muchas formas diferentes de abordar esta cuestión de forma inadecuada), podría estar tratando a las personas con un seguimiento a corto plazo como si hubieran tenido un periodo de seguimiento completo.

Pueden surgir diferentes problemas en función de cómo se lleve a cabo ese "análisis de no supervivencia" inadecuado: por ejemplo, surgen problemas si el conjunto de riesgos se acumula a lo largo de un periodo (por ejemplo, bebés nacidos con una afección concreta a lo largo de un periodo de estudio de diez años) y los resultados tienden a producirse en periodos más tempranos (por ejemplo, mayor riesgo en los dos primeros años de vida).


5. Así que quizá lo que los modelos de supervivencia han encontrado es una forma de mantener en el análisis a todas las personas que contribuyeron con tiempo de supervivencia, independientemente de si conocemos o no su estado de resultado, mientras que otros métodos simplemente descartarían todos los datos de esas personas como perdidos.

Creo que es un resumen razonable: básicamente, se puede incluir a las personas en el tiempo de seguimiento hasta el momento en que se agota su información. Así que se puede considerar que el análisis de supervivencia es más eficiente, ya que se puede (hablando en términos generales) incluir toda la información disponible del numerador y el denominador (sujeto a un montón de suposiciones, bien descritas en otro lugar).

Para llevar a cabo un "análisis de no supervivencia" válido sería necesario que todos los pacientes tuvieran el mismo tiempo de seguimiento potencial (por ejemplo, que todos los pacientes con cáncer tuvieran un seguimiento de al menos cinco años), independientemente de su estado.


Como nota final sobre cómo las cosas pueden ir mal cuando no se tiene en cuenta la censura: Como ocurre con cualquier investigación, hay muchas formas diferentes de enfocar ingenuamente este tipo de análisis sin tener en cuenta la censura: por ejemplo, he visto algunas ideas de análisis que incluirían a las personas en el seguimiento si hubieran tenido el suceso en cualquier momento, pero sólo incluirían en el denominador a las personas sin sucesos si hubieran llegado al tiempo final de seguimiento (resultado neto: ¡malas noticias!).

3voto

Actualización : @James Stanley aborda el mismo punto en su respuesta; véase el punto #4.


Esto no es una respuesta, sino un comentario ampliado para aclarar cierta terminología y destacar un supuesto importante.

Tú escribes:

si no sabe qué ocurrió después de que el Sr. Smith abandonara su estudio (es decir, que se perdiera durante el seguimiento, es decir, que fuera censurado)...

dando a entender que "pérdida de seguimiento" es lo mismo que "censura". No exactamente.

Supongamos que realizamos un ensayo controlado aleatorizado (ECA) de tratamiento T frente a control C y el resultado de interés Y es el tiempo transcurrido hasta el evento (o equivalentemente, la supervivencia). Empezamos a reclutar sujetos el 1 de enero y el estudio finaliza el 31 de diciembre del mismo año. Realizamos un seguimiento de los sujetos cada mes desde el reclutamiento hasta el 31 de diciembre.

  • pérdidas durante el seguimiento : El paciente A es reclutado y aleatorizado a T o C en enero. Tenemos datos de las 8 primeras visitas y ningún dato de las 3 últimas visitas de octubre a diciembre. Sabemos que el paciente sobrevivió al menos 8 meses.
  • censura : El paciente B es reclutado y aleatorizado a T o C en Abr. Tenemos datos de las 8 visitas hasta que el estudio concluye en Dic. Sabemos que el paciente sobrevivió al menos 8 meses.

Usted se preguntará: ¿Por qué distinguir entre pérdida de seguimiento y censura? Los pacientes A y B parecen "similares" ("intercambiables"): los seguimos durante 8 visitas después del tratamiento, por lo que sabemos que sobrevivieron al menos 8 meses, pero no sabemos cuánto tiempo sobrevivieron.

Aportarían el mismo término $\operatorname{S}(t_i = \text{8 months} | \theta)$ en la función de verosimilitud. [Aquí me refiero a la probabilidad $L_t(\theta)$ en la respuesta de @Ben].

La sutileza es que no sabemos por qué el paciente A abandonó el estudio. A menudo, en el análisis, cuando no sabemos algo, suponemos que ocurrió al azar. Esto hará que las matemáticas funcionen tal y como se describe en la respuesta de Ben.

Sin embargo, supongamos que el tratamiento tiene efectos secundarios graves y que los pacientes que lo recibieron tienen más probabilidades de interrumpirlo antes de tiempo. Esto significa que los sujetos del grupo de tratamiento tienen más probabilidades de perderse durante el seguimiento. Esto introduce (potencialmente) un sesgo en la estimación del efecto del tratamiento, a menos que se realicen análisis más sofisticados.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X