34 votos

En el análisis de supervivencia, ¿por qué utilizamos modelos semiparamétricos (riesgos proporcionales de Cox) en lugar de modelos totalmente paramétricos?

He estado estudiando el modelo de riesgos proporcionales de Cox, y esta cuestión se pasa por alto en la mayoría de los textos.

Cox propuso ajustar los coeficientes de la función de Peligro utilizando un método de verosimilitud parcial, pero ¿por qué no ajustar simplemente los coeficientes de una función de Supervivencia paramétrica utilizando el método de máxima verosimilitud y un modelo lineal?

En los casos en los que se tienen datos censurados, se puede encontrar simplemente el área bajo la curva. Por ejemplo, si su estimación es de 380 con una desviación estándar de 80, y una muestra está censurada >300, entonces hay un 84% de probabilidad para esa muestra en el cálculo de la probabilidad asumiendo un error normal.

43voto

Eero Puntos 1612

Si conoce la distribución paramétrica que siguen sus datos, entonces tiene sentido utilizar un enfoque de máxima probabilidad y la distribución. La verdadera ventaja de la regresión de riesgos proporcionales de Cox es que se pueden ajustar modelos de supervivencia sin conocer (o asumir) la distribución. Usted da un ejemplo utilizando la distribución normal, pero la mayoría de los tiempos de supervivencia (y otros tipos de datos para los que se utiliza la regresión PH de Cox) no se acercan a seguir una distribución normal. Algunos pueden seguir una log-normal, o una Weibull, u otra distribución paramétrica, y si usted está dispuesto a hacer esa suposición, entonces el enfoque paramétrico de máxima probabilidad es genial. Pero en muchos casos del mundo real no sabemos cuál es la distribución apropiada (o incluso una aproximación lo suficientemente cercana). Con la censura y las covariables no podemos hacer un simple histograma y decir "eso me parece una distribución ...". Así que es muy útil tener una técnica que funcione bien sin necesidad de una distribución específica.

¿Por qué utilizar el peligro en lugar de la función de distribución? Considere la siguiente afirmación: "Las personas del grupo A tienen el doble de probabilidades de morir a los 80 años que las del grupo B". Esto podría ser cierto porque las personas del grupo B tienden a vivir más tiempo que las del grupo A, o podría ser porque las personas del grupo B tienden a vivir menos tiempo y la mayoría de ellas mueren mucho antes de los 80 años, lo que da una probabilidad muy pequeña de que mueran a los 80 años, mientras que el número de personas del grupo A que viven hasta los 80 años es suficiente para que un buen número de ellas mueran a esa edad, lo que da una probabilidad mucho mayor de morir a esa edad. Así que la misma afirmación podría significar que estar en el grupo A es mejor o peor que estar en el grupo B. Lo que tiene más sentido es decir, de esas personas (en cada grupo) que vivieron hasta los 80 años, qué proporción morirá antes de cumplir los 81 años. Eso es el riesgo (y el riesgo es una función de la función de distribución/función de supervivencia/etc.). El riesgo es más fácil de trabajar en el modelo semiparamétrico y puede dar información sobre la distribución.

19voto

Brettski Puntos 5485

"Nosotros" no necesariamente. La gama de herramientas de análisis de supervivencia va desde las totalmente no paramétricas, como el método de Kaplan-Meier, hasta los modelos totalmente paramétricos en los que se especifica la distribución del peligro subyacente. Cada uno de ellos tiene sus ventajas e inconvenientes.

Los métodos semiparamétricos, como el modelo de riesgos proporcionales de Cox, permiten no especificar la función de riesgo subyacente. Esto puede ser útil, ya que no siempre conocemos la función de riesgo subyacente y en muchos casos también no me importa . Por ejemplo, muchos estudios de epidemiología quieren saber "¿La exposición X disminuye el tiempo hasta el evento Y?". Lo que les importa es la diferencia entre los pacientes que tienen X y los que no tienen X. En ese caso, el peligro subyacente no importa realmente, y el riesgo de especificarlo mal es peor que las consecuencias de no conocerlo.

Sin embargo, hay veces que esto tampoco es cierto. He trabajado con modelos totalmente paramétricos porque el riesgo subyacente fue de interés.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X