6 votos

¿Matrices de confusión con porcentajes en lugar de número de instancias?

La mayoría de las matrices de confusión que he visto contienen el número de instancias en cada celda. ¿No es más fácil de leer una matriz de confusión con el porcentaje de instancias en cada celda? ¿Este enfoque es erróneo o va en contra de alguna regla no escrita con respecto a las matrices de confusión?

Tal matriz de confusión se verá así, donde cada una de las 10 etiquetas de clase constituye el 10 por ciento del conjunto de datos y el total es el 100 por ciento. El 9,06 por ciento del conjunto de datos pertenecía a la clase 1 y fue asignado a la clase 1. Por lo tanto, el 90,60 por ciento de las instancias de la clase 1 están clasificadas correctamente.

example

8voto

Una matriz de confusión en porcentajes sería apropiada si la distribución entre sus clases es plana (ya sea de forma natural, o intencionalmente muestreada de esa manera). Si no es así, una matriz de confusión de este tipo puede dar lugar a una gran confusión.

Es útil tener tanto: el número de instancias en general (para ver los sesgos) como los porcentajes para los datos muestreados de una distribución plana.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X