Tengo un clasificador que estoy utilizando para clasificar los datos de los pacientes en una de las dos clases.
En concreto, tengo muchos pacientes, y para cada uno de ellos tengo un número de puntos de datos (multivariables), registrados una vez al día. Para cada punto de datos diario, el clasificador toma ese punto de datos y lo clasifica en una de las dos clases. Las dos clases están muy desequilibradas, quizá en torno al 90% contra el 10%.
Inicialmente, quería calcular una curva ROC para cada paciente y, a continuación, observar la dispersión del AUC en todos los pacientes, con el fin de hacerme una idea de la reproducibilidad de mi clasificador. Sin embargo, en ocasiones, un paciente no tiene casos positivos, es decir, todos los puntos de datos pertenecen a la clase mayoritaria (la clase negativa). En este caso no tiene sentido hablar de curva ROC.
Por supuesto, podría descartar a los pacientes sin resultados positivos, pero eso sesgaría mi medida de AUC media. Lo mismo ocurriría si simplemente dijera AUC=0,5 (sin información) para los pacientes sin positivos.
¿Existe alguna alternativa sensata e imparcial a las curvas ROC que pueda utilizar para medir la calidad del clasificador en esta población de pacientes?
(Para mayor claridad: Aquí no me importa la dinámica de las series temporales, simplemente estoy clasificando cada punto de datos de forma aislada)