Actualmente estoy trabajando en un RandomForest basado en el método de predicción usando la secuencia de la proteína de datos. Me han generado dos modelos de primer modelo (NF), utilizando el conjunto estándar de características, y el segundo modelo (HF) uso de híbridos características. He hecho Mathews Coeficiente de Correlación (MCC) y la Precisión de cálculo y los siguientes son mis resultados:
Modelo 1 (NF): la Formación de Precisión - 62.85% de Exactitud de las Pruebas - del 56,38 MCC - 0.1673
Modelo 2 (HF): la Formación de Precisión - 60.34 Exactitud de las Pruebas - 61.78 MCC - 0.1856
Los datos de prueba es un conjunto de datos independiente (es decir, no se incluyen en los datos de entrenamiento).
Dado que existe un trade-off en la precisión y la MCC entre los modelos que estoy confundido acerca de el poder de predicción de los modelos. Podría usted por favor comparta sus pensamientos sobre que modelo debo considerar para su posterior análisis? Aparte de la Precisión y la MCC es allí cualquier otra medida que debo considerar para la validación?
Gracias de antemano.