Tengo la siguiente salida de un modelo de árboles de regresión potenciados y me gustaría calcular la desviación total explicada.
mean total deviance = 1.283
mean residual deviance = 0.107
estimated cv deviance = 0.212 ; se = 0.045
training data correlation = 0.97
cv correlation = 0.937 ; se = 0.016
training data AUC score = 1
cv AUC score = 0.996 ; se = 0.002
He encontrado dos métodos para hacer esto que me dan una respuesta diferente.
1) D2 = 1 – (residual deviance/total deviance)
(Nieto y Mélin, 2017)
Con mis resultados esta ecuación es
D2 = 1 - (0.107/1.283) = 0.92
2) D2 = (total deviance - cross validated residual deviance)/total deviance
(Leathwick et al., 2006)
Con mis resultados esta ecuación es
D2 = (1.283-0.212)/1.283 = 0.83
El documento del método 2 no proporciona la ecuación en su texto, pero está claro, dados los resultados de su modelo (Tabla 3, pp.272), que así es como se calculó. Además, hay una pregunta ici que discute este método.
¿Cuál de estos métodos es correcto?