Considere una situación en la que estamos ejecutando un clasificador (el algoritmo de clasificación no importa aquí), y las etiquetas de clase se basan en una partitura. Si la puntuación > 0, el punto de datos es Una etiqueta, si la puntuación < 0, el punto de datos etiquetados B.
Todos los datos de entrenamiento contiene datos de puntos positivos o negativos de las puntuaciones. Sin embargo, en mis datos de prueba, hay un par de puntos que volver puntuación = 0. ¿Cómo debo medir la precisión y el recall en este escenario donde algunos de los puntos que no pueden ser clasificados en alguna clase?
[información adicional de un comentario más abajo] me enfrenté a este en un sentimiento de la tarea de clasificación. La normalizado de los puntajes en el rango [-1,1], siendo 0 la puntuación de los documentos con ningún sentimiento. Sucedió, pues, que yo no tenía neutral documentos en mis datos de entrenamiento, pero en los datos de prueba, algunos de los documentos devueltos con una puntuación de 0.