Dado
- un conjunto de datos con instancias $x_i$ junto con $N$ clases en las que cada instancia $x_i$ pertenece exactamente a una clase $y_i$
- un clasificador multiclase
Después de la formación y las pruebas, básicamente tengo una tabla con el verdadero clase $y_i$ y el previsto clase $a_i$ para cada instancia $x_i$ en el conjunto de pruebas. Así que para cada instancia tengo una coincidencia ( $y_i= a_i$ ) o un fallo ( $y_i\neq a_i$ ).
¿Cómo puedo evaluar la calidad del partido? La cuestión es que algunas clases pueden tener muchos miembros, es decir, que muchas instancias pertenecen a ella. Obviamente, si el 50% de todos los puntos de datos pertenecen a una clase y mi clasificador final acierta en un 50%, no he ganado nada. Podría haber hecho un clasificador trivial que diera como resultado la clase más grande sin importar la entrada.
¿Existe un método estándar para estimar la calidad de un clasificador basado en los resultados conocidos del conjunto de pruebas de coincidencias y aciertos para cada clase? ¿Quizás sea incluso importante distinguir las tasas de coincidencia para cada clase en particular?
El enfoque más sencillo que se me ocurre es excluir los partidos correctos de la clase más grande. ¿Qué más?