Actualmente estoy intentando aplicar el análisis de supervivencia a varias especies arbóreas cuyo crecimiento y fenología se controlaron durante 4 años y se separaron en tres grupos de tratamiento. A partir de estos datos he creado una variable de supervivencia que me da la información de si el individuo murió o no durante esos 4 años. De este modo, he creado para cada especie datos adecuados para el análisis de supervivencia utilizando Surv
y survfit
del paquete "survival" para crear un objeto de supervivencia en R y representar gráficamente este objeto para los tres tratamientos.
Mi pregunta se refiere a cómo tratar los no eventos en un grupo de tratamiento. Para algunas especies tengo un número muy pequeño de eventos (es decir, muertes), lo que me deja un número bastante alto de no eventos (por ejemplo, para 360 individuos, sólo se registraron 55 eventos en todos los tratamientos, con un tratamiento sin ningún evento).
Ya he buscado en internet cómo trabajar con estos, y principalmente he encontrado que está bien, la prueba de razón de verosimilitud sigue siendo válida (mientras que la prueba de Wald no lo es). Sin embargo, este problema me da valores muy altos para la hazard ratio ( exp(coef)
) en el resumen del coxph
(como 1,012e+09 asociado a un valor p de 0,996, cuando es obvio que existe una diferencia significativa entre los tratamientos al observar el gráfico).
Me preguntaba si alguien podría ayudarme a resolver este problema :
- ¿es correcto tener estimaciones tan altas de la hazard ratio (
exp(coef)
) ? - ¿refleja realmente la diferencia observada entre tratamientos, o el valor p está realmente sobreestimado?
Cualquier ayuda sobre cómo trataríais esto, o cómo lo hicisteis en vuestra experiencia anterior sería aceptada con mucho gusto.