1 votos

Confusión sobre el cálculo de la matriz de confusión

Tengo una confusión al calcular la matriz de confusión. Así que permítanme decir, yo programador con idea muy básica de probabilidad, etc. cuando entrené un modelo de aprendizaje automático utilizando Microsoft Azure, tengo algo como esto:

enter image description here

Esto me parece bien y lo que esperaba. Sin embargo, cuando Google Prediction API lo generó, hizo algo como esto:

enter image description here

La última línea es el total de filas de los datos. ¿Cómo convierto esto en algo similar a lo anterior?

Gracias.

1voto

Nikolai Prokoschenko Puntos 2507

Parece que las filas de su matriz de porcentajes suman 100%, pero las columnas no.

Si eso es lo que quieres, tienes que dividir cada celda de tu matriz de recuento por la suma de la fila en la que se encuentra, en lugar de por la suma de la columna (suponiendo que la API de Google utilice filas para la clase real; si no es así, transpón primero la matriz de recuento).

Personalmente, preferiría utilizar la matriz de recuento, ya que se pierde menos información y se evita la ambigüedad de en qué sentido suman los números $100\%$ . Ejemplo de Wikipedia también utiliza recuentos

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X