Estoy teniendo problemas para la comprensión de la curva ROC.
Hay alguna ventaja o mejora en el área bajo la curva ROC si puedo construir diferentes modelos de cada subconjunto del conjunto de entrenamiento, y usarlo para producir una probabilidad? Por ejemplo, si $y$ tiene valores de $\{a, a, a, a, b, b, b, b\}$, y voy a construir el modelo de $A$ mediante $a$ a partir del 1ro-4to valores de $y$ y del 8 al 9 de valores de $y$ y construir el modelo de $B$, mediante el uso mantenido de datos del tren. Finalmente, generar la probabilidad. Cualquier pensamiento / comentarios serán muy apreciados.
Aquí es el código r para una mejor explicación para mi pregunta:
Y = factor(0,0,0,0,1,1,1,1)
X = matirx(rnorm(16,8,2))
ind = c(1,4,8,9)
ind2 = -ind
mod_A = rpart(Y[ind]~X[ind,])
mod_B = rpart(Y[-ind]~X[-ind,])
mod_full = rpart(Y~X)
pred = numeric(8)
pred_combine[ind] = predict(mod_A,type='prob')
pred_combine[-ind] = predict(mod_B,type='prob')
pred_full = predict(mod_full, type='prob')
Así que mi pregunta es, el área bajo la curva ROC de pred_combine
vs pred_full
.