7 votos

ROC-AUC y Precision-Recall para clasificadores aleatorios en problemas de desequilibrio de clase

Siempre he entendido siempre la diagonal de la república de china de la parcela para representar el rendimiento de un "azar" clasificador (correspondiente a una de las AUC de 0.5). Es este sigue siendo el caso para un reparto muy desigual de los problemas? (por ejemplo, 10 positivos vs 1000 negativos).

Si no, hay alguna manera de estimar el ROC-AUC para un "azar" clasificador (totalmente ciego a las características y a la proporción de positivos y negativos).

¿Qué pasa si ponemos a prueba contra un aleatorio estratificado clasificador? (es decir, uno que adivine positivos y negativos al azar, sino según la proporción de positivos y negativos).

¿Qué se puede decir acerca de la métrica de Precisión Promedio en los mismos escenarios? (aleatorio y estratificado al azar).

6voto

Marc Claesen Puntos 9818

El área bajo la curva ROC es insensible al balance de clase. El área bajo la curva PR, por otro lado, está muy influenciada por esto.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X