3 votos

¿Existe un nombre para esta técnica de visualización (clasificación binaria)?

Estoy trabajando en un problema de clasificación binaria con etiquetas de clase $Y \in {0, 1}$ y tener un clasificador que emita la probabilidad $P(Y=1|X=x)$ para cada ejemplo de prueba $x$ . Para resumir el rendimiento del clasificador en un conjunto de validación, trazo un histograma de probabilidades predichas para cada etiqueta todo en la misma figura. Un ejemplo lo ilustra mejor que nadie.

import numpy as np
import seaborn as sns
from matplotlib import pyplot as plt

from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression

X, y = load_iris(return_X_y=True)
X_train, X_test, y_train, y_test = train_test_split(X[:100], y[:100], test_size=0.5)
clf = LogisticRegression()
clf.fit(X_train, y_train)
class_probs = clf.predict_proba(X_test)

y0_preds = class_probs[np.where(y_test == 0), 1]
y1_preds = class_probs[np.where(y_test == 1), 1]
sns.distplot(y0_preds, color='blue')
sns.distplot(y1_preds, color='red')
plt.show()

what is this called?

2voto

Aaron Puntos 36

Se trata de un histograma con densidad kernel superpuesta para dos variables, sin solapamiento en los datos. Si busca un nombre para el gráfico, le sugiero "Histograma y KDE de probabilidades de clasificación predichas". (Tendrá que añadir etiquetas de eje y una leyenda a su gráfico para que tenga sentido).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X