Posible duplicado:
Optimización de las curvas de precisión-recuperación en caso de desequilibrio de clases
Construí un modelo de clasificación y lo probé con un conjunto de datos de validación. El conjunto positivo está compuesto por 86 casos y el conjunto negativo por 1256 casos. La matriz de confusión es la siguiente
True positive True negative precision
Predict positive 55 338 13.99%
Predict negative 31 918 96.73%
Recall 63.95% 73.09%
La precisión y el recuerdo de este clasificador no son buenos, especialmente para la precisión positiva. Sin embargo, los casos negativos son mucho más numerosos que los positivos. No estoy muy seguro de que, para este tipo de datos desequilibrados, podamos seguir utilizando la precisión y el recuerdo como evaluación del rendimiento, como es habitual.