zph()
comprueba el supuesto de proporcionalidad, utilizando los residuos de Schoenfeld frente al tiempo transformado. Tener valores p muy pequeños indica que hay coeficientes dependientes del tiempo de los que hay que ocuparse. Es decir, el supuesto de proporcionalidad no comprueba la linealidad - el modelo PH de Cox es semiparamétrico y por lo tanto no hace ningún supuesto en cuanto a la forma del peligro. El supuesto de proporcionalidad es que la tasa de peligro de un individuo es relativamente constante en el tiempo, y esto es lo que cox.zph()
pruebas.
Si una covariable rompe la suposición, podría necesitar fijación de ya que hay un tiempo dependiente coeficientes . Para resolver esto puede interactuar el coeficiente con el tiempo explícito, o utilizar estratos basados en los residuos trazados. Para una guía detallada sobre cómo hacer esto, ver mi respuesta aquí: Modelo de Cox ampliado y cox.zph
Si no se hace nada al respecto, podría invalidar los resultados, de forma similar a como podría ocurrir si se rompen los supuestos de la regresión lineal.
Editar:
el efecto de tener un diploma en la duración de la búsqueda de empleo frente a no tenerlo. Mismo escenario: coxph() y zph() significativos. ¿Puedo decir que tener un diploma tiene un efecto sobre la duración de la búsqueda de empleo?
Con toda probabilidad, sí, se podría decir eso. Sin embargo, dada la prueba fallida de la suposición de proporcionalidad, no se puede confiar en el coeficiente de tener un diploma (llamémoslo $diploma$ ). El modelo de Cox asume que el efecto $diploma$ tiene en el tiempo para encontrar un trabajo (vamos a llamar a esto $t_{job}$ ) es constante en el tiempo. Esto significa que si $diploma$ aumenta el % de encontrar un empleo en un 35%, este aumento es independiente del tiempo.
En el caso de que $diploma$ no cumplió con el supuesto de proporcionalidad, como cuando el cox.zph()
prueba para ello es significativa, hay que hacer ajustes. Si $diploma$ Si el coeficiente de la empresa cambia linealmente con el tiempo (es decir, cuanto más tiempo se tarda en encontrar un trabajo, el beneficio relativo de tener un diploma disminuye linealmente), entonces hay que añadir una interacción: $diploma \times t_{job}$ . En este caso, el valor de $diploma$ será la inicial (en $t_0$ diferencia entre tener un diploma y no tenerlo), y la interacción significaría la disminución/aumento de ese valor inicial con cada unidad de tiempo que pasa (horas/días, etc., como se cuente el tiempo). Hazlo y comprueba cox.zph()
de nuevo. Si no es significativo, probablemente se puede dejar así. Tiene más sentido teórico que tener el cambio de coeficiente en puntos de tiempo específicos.