18 votos

¿Cuáles son las ventajas y los inconvenientes de utilizar el método logrank frente al método Mantel-Haenszel para calcular el cociente de riesgos en el análisis de supervivencia?

Una forma de resumir la comparación de dos curvas de supervivencia es calcular la hazard ratio (HR). Existen (al menos) dos métodos para calcular este valor.

  • Método Logrank. Como parte de los cálculos de Kaplan-Meier, calcule el número de eventos observados (muertes, por lo general) en cada grupo ( $Oa$ y $Ob$ ), y el número de sucesos esperados suponiendo una hipótesis nula de ausencia de diferencias en la supervivencia ( $Ea$ y $Eb$ ). La razón de riesgo es entonces: $$ HR= \frac{(Oa/Ea)}{(Ob/Eb)} $$
  • Método Mantel-Haenszel. Primero calcule V, que es la suma de las varianzas hipergeométricas en cada punto temporal. Luego calcule la razón de riesgo como: $$ HR= \exp\left(\frac{(Oa-Ea)}{V}\right) $$ Obtuve estas dos ecuaciones del capítulo 3 de Machin, Cheung y Parmar, Análisis de supervivencia . En ese libro se afirma que los dos métodos suelen dar resultados muy parecidos, y de hecho así ocurre con el ejemplo del libro.

Alguien me ha enviado un ejemplo en el que los dos métodos difieren en un factor de tres. En este ejemplo concreto, es obvio que la estimación logrank es sensata, y que la estimación Mantel-Haenszel está muy alejada. Mi pregunta es si alguien tiene algún consejo general sobre cuándo es mejor elegir la estimación logrank de la hazard ratio, y cuándo es mejor elegir la estimación Mantel-Haenszel. ¿Tiene que ver con el tamaño de la muestra? ¿Número de empates? ¿Relación del tamaño de las muestras?

11voto

CodingWithoutComments Puntos 9412

Creo que he encontrado la respuesta (a mi propia pregunta). Si el supuesto de riesgos proporcionales es cierto, los dos métodos dan estimaciones similares del cociente de riesgos. Ahora creo que la discrepancia que encontré en un ejemplo concreto se debe a que ese supuesto es dudoso.

Si la hipótesis de riesgos proporcionales es cierta, entonces una gráfica de log(tiempo) frente a log(-log(St)) (donde St es la supervivencia proporcional en el tiempo t) debería mostrar dos líneas paralelas. A continuación se muestra el gráfico creado a partir del conjunto de datos del problema. No parece lineal. Si la suposición de riesgos proporcionales no es válida, entonces el concepto de razón de riesgos no tiene sentido, y por tanto no importa qué método se utilice para calcular la razón de riesgos.

alt text

Me pregunto si la discrepancia entre las estimaciones logrank y Mantel-Haenszel del cociente de riesgos puede utilizarse como método para probar el supuesto de riesgos proporcionales.

7voto

Omar Kooheji Puntos 384

Si no me equivoco, el estimador log-rank al que hace referencia también se conoce como estimador de Pike. Creo que generalmente se recomienda para HR < 3 porque muestra menos sesgo en ese rango. El siguiente documento puede ser de interés (tenga en cuenta que el documento se refiere a ella como O / E):

[...] El método O/E está sesgado pero, dentro del rango de valores del cociente de las tasas de riesgo de interés en los ensayos clínicos, es más eficiente en términos de error cuadrático medio que la LMC o el método de Mantel-Haenszel para todos los ensayos excepto los más grandes. El método de Mantel-Haenszel está mínimamente sesgado, da respuestas muy próximas a las obtenidas con LMC y puede utilizarse para proporcionar intervalos de confianza aproximados satisfactorios.

7voto

palmsey Puntos 3799

En realidad, existen varios métodos más y la elección a menudo depende de si se está más interesado en buscar diferencias tempranas, diferencias tardías o -como en el caso de la prueba de rangos logarítmicos y la prueba de Mantel-Haenszel- dar la misma importancia a todos los puntos temporales.

A la pregunta que nos ocupa. De hecho, la prueba de log-rank es una forma de la prueba de Mantel-Haenszel aplicada a los datos de supervivencia. La prueba de Mantel-Haenszel suele utilizarse para comprobar la independencia en tablas de contingencia estratificadas.

Si intentamos aplicar la prueba MH a los datos de supervivencia, podemos empezar suponiendo que los sucesos en cada tiempo de fallo son independientes. A continuación, estratificamos por tiempo de fallo. Utilizamos los métodos MH para hacer de cada tiempo de fallo un estrato. No es sorprendente que a menudo den el mismo resultado.

La excepción se produce cuando se produce más de un suceso simultáneamente: varias muertes exactamente en el mismo momento. No recuerdo en qué difiere entonces el tratamiento. Creo que la prueba de rango logarítmico calcula la media de los posibles ordenamientos de los tiempos de fallo ligados.

Así que la prueba de log-rank es la prueba MH para datos de supervivencia y puede tratar con empates. Nunca he utilizado la prueba MH para datos de supervivencia.

3voto

palmsey Puntos 3799

He dado con un sitio web y una referencia que tratan exactamente esta cuestión:

http://www.graphpad.com/faq/viewfaq.cfm?faq=1226 Empieza por "Los dos métodos comparados".

El sitio hace referencia al artículo de Berstein enlazado (más arriba):

http://www.jstor.org/stable/2530564?seq=1

El sitio web resume muy bien los resultados de Berstein et al, así que lo citaré:

T casi idénticos). [ ] resultados pueden diferir cuando varios sujetos mueren al mismo tiempo o cuando el cociente de riesgos está lejos de 1,0.

B datos simulados con ambos métodos (1). En todas sus simulaciones, la supuesto de riesgos proporcionales cierto. Los dos métodos dieron valores muy similares. El método logrank (al que se refieren como el método O/E ) proporciona valores más cercanos a a 1,0 que el verdadero Hazard Ratio, especialmente cuando la hazard ratio es o el tamaño de la muestra es grande.

W menos precisos. Los métodos logrank tienden a presentar cocientes de riesgo más cercanos a 1,0 (por lo que el cociente de es demasiado pequeño cuando el hazard ratio es superior a 1,0, y demasiado grande cuando la hazard ratio es inferior a 1,0). El método Mantel-Haenszel [ ] que se alejan más de 1,0 (por lo que la hazard ratio notificada es demasiado grande cuando la hazard ratio es mayor que 1,0, y demasiado pequeño cuando el cociente de riesgos es inferior a 1,0).

No probaron los dos métodos con datos simulados en los que el supuesto de riesgos proporcionales no es cierta. I he visto un conjunto de datos en el que las dos estimación de HR eran muy diferentes (por un factor de tres), y el supuesto de riesgos proporcionales era dudosa para esos datos. Parece que el Mantel-Haenszel da más importancia peso a las diferencias en el riesgo en puntos temporales tardíos, mientras que el da el mismo peso en todas partes (pero no he explorado esto en detalle). Si observa valores de HR [ ] sobre si la suposición de de riesgos proporcionales es razonable. Si esa suposición no es razonable, entonces, por supuesto, todo el concepto de una [ ] curva completa no tiene sentido.

El sitio también hace referencia al conjunto de datos en el que "las dos estimaciones de HR eran muy diferentes (por un factor de tres)", y sugiere que la hipótesis de PH es una consideración clave.

Entonces pensé: "¿Quién es el autor del sitio?". Después de buscar un poco descubrí que era Harvey Motulsky. Así que Harvey he conseguido referenciarte respondiendo a tu propia pregunta. ¡Te has convertido en la autoridad!

¿Es el "conjunto de datos problemático" un conjunto de datos disponible públicamente?

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X