Considere un escenario en el que se le proporciona la matriz KnownLabel y la matriz PredictedLabel. Me gustaría medir la bondad de la matriz PredictedLabel frente a la matriz KnownLabel.
Pero el reto aquí es que la matriz KnownLabel tiene pocas filas con un solo 1 y otras pocas filas tienen muchos 1's (esas instancias son multietiquetadas). Un ejemplo de matriz KnownLabel se da a continuación.
A =[1 0 0 0
0 1 0 0
0 1 1 0
0 0 1 1
0 1 1 1]
En la matriz anterior, los datos 1 y 2 son datos de una etiqueta, los datos 3 y 4 son datos de dos etiquetas y los datos 5 son datos de tres etiquetas.
Ahora tengo la matriz de PredictedLabel de la instancia de datos utilizando un algoritmo.
Me gustaría conocer varias medidas que se pueden utilizar para medir la bondad de la matriz PredictedLabel frente a la matriz KnownLabel.
Puedo pensar en la diferencia de normas de frobeinus entre ellos como una de las medidas. Pero estoy buscando la medida como la precisión $(= \frac{\text{Correctly_predicted_instance}}{\text{total_instance}})$
Aquí cómo podemos definir el $\rm Correctly\_predicted$ para la instancia de datos múltiples?