Estoy ajustando un modelo de regresión logística para la probabilidad de que los pacientes sufran morbilidad tras la cirugía. La herramienta de predicción más utilizada actualmente es POSSUM (Physiological and Operative Severity Score for the enUmeration of Mortality and Morbidity), con la que me gustaría comparar mi modelo.
En cuanto a la discriminación, he calculado el área bajo las curvas ROC para ambas y me gustaría compararlas.
Parece que en Stata el comando a utilizar es roccomp
. Esto produce un estadístico chi2 y un valor p.
El equivalente en R parece requerir el pROC
y la función a utilizar es roc.test()
. Sin embargo, esta función devuelve un estadístico z y un valor p.
Mirando la documentación, ambos parecen ser implementaciones de los métodos de DeLong et al para comparar AUROCs[1], pero no puedo entender por qué uno da un chi2 y el otro un z-estadístico. ¿Son las pruebas equivalentes?
Referencia : 1. Elisabeth R. DeLong, David M. DeLong y Daniel L. Clarke-Pearson (1988) "Comparing the areas under two or more correlated receiver operating characteristic curves: a nonparametric approach". Biometrics 44, 837--845.
EDITAR : ¿Tiene esto algo que ver con la explicación: ¿A qué nivel se $\chi^2$ prueba matemáticamente idéntica a una $z$ -¿prueba de proporciones? ?