Tengo un gran conjunto de datos de imágenes que fue clasificado por una ConvNet en diferentes clases (objetos). Para cada imagen se da la probabilidad top-1 softmax, que oscila entre 0 y 1. Es la salida de una tarea de clasificación multiclase, por lo que la salida de la clasificación softmax contiene múltiples valores, por ejemplo (0,6, 0,1, 0,2, 0,1). La probabilidad top-1, en este ejemplo, sería 0,6. En mi conjunto de datos, la probabilidad top-1 softmax de muchas imágenes es bastante baja (por ejemplo, 0,1), lo que significa que la probabilidad de que la imagen muestre la clase predicha es baja. Ahora me pregunto si debo establecer un umbral en las probabilidades softmax y cómo hacerlo. Mi método consiste en comparar las etiquetas predichas con las etiquetas reales (que están disponibles para aproximadamente el 10% del conjunto de datos), trazar una curva ROC y calcular el índice Youden y el punto de corte óptimo. A continuación, utilicé este punto de corte óptimo como umbral para las probabilidades softmax y eliminé todas las imágenes del conjunto de datos con una probabilidad softmax top-1 inferior a este punto de corte. Esto redujo mi conjunto de datos a ~1/4 de su tamaño original.
Mis preguntas son: - ¿Puedo utilizar el enfoque descrito para definir un umbral para las probabilidades top-1 softmax? - ¿Existen otros enfoques, por ejemplo, definir un umbral para cada clase? ¿Y cómo se haría esto?