Estoy entrenando la regresión logística para la clasificación binaria en un conjunto de datos etiquetados. Ahora estoy usando las mismas entradas y prediciendo sus puntajes usando el modelo.
Por ejemplo, tengo una entrada con etiqueta 0 y un puntaje predicho de 0.1 y otra entrada con etiqueta conocida 0 y puntaje predicho 0.2. Básicamente estoy usando el modelo para obtener la probabilidad para datos vistos (en oposición a datos no vistos).
Y estoy intentando argumentar si la probabilidad predicha muestra el orden/clasificación de las entradas - ¿la segunda entrada del ejemplo está más cerca de la clase 1 que la primera entrada? ¿O simplemente muestran el rendimiento de mi modelo?
Esto contradice el enfoque común cuando se usa un modelo entrenado en datos no vistos, y siento que comparar los puntajes de los datos de entrenamiento no tiene sentido, pero no puedo entender por qué