Tengo un conjunto de datos con dos clases de elementos. También tengo dos métodos que asignan probabilidades (complementarias) a cada elemento del conjunto de datos de pertenecer a una u otra clase.
Dado que trabajo con probabilidades (en lugar de valores duros de clasificación 0,1), me indicaron reglas de puntuación como una forma de evaluar qué método funciona mejor. Las dos reglas más utilizadas parecen ser:
- Regla de puntuación logarítmica (Pérdida logarítmica, pérdida logística, pérdida de entropía cruzada)
- Regla de puntuación Brier/cuadrática (Puntuación de Brier)
con la pérdida de registros que aparentemente es el enfoque estándar (¿lo es?). También he encontrado scikit-learn
's roc_auc_score , una aplicación de la:
- Área bajo la curva (AUC, ROC-AUC)
que parece hacer prácticamente lo mismo.
Mi pregunta es: ¿es alguno de ellos intrínsecamente "mejor" que el otro de alguna forma? También podría utilizar los tres. ¿Es esto aconsejable?