Estoy trabajando en una clasificación binaria con un conjunto de datos desequilibrado de proporción 77:23.
La clase 1 es la clase minoritaria.
Actualmente, estoy explorando diferentes técnicas de selección de características y fue entonces cuando probé mlxtend's sequential forward selection and backward selection
Digamos que mi objetivo es seleccionar el best 5 features from the dataset that will result in best value for the metric chosen
Los resultados son los siguientes
Las 5 mejores funciones de SFS \= f1,f2,f3,f4 y f5
Las 5 mejores funciones de SBS \= f1,f2,f3,f7 y f8.
No esperaba ver una diferencia en la salida de la mejor característica devuelta entre 2 métodos.
Como se trata de un método basado en una envoltura, estoy utilizando el mismo estimador (RF) con los mismos hiperparámetros tanto para SFS como para SBS, pero el resultado sigue siendo diferente.
¿Hay alguna forma de saber/entender por qué la salida devuelta por SFS es diferente de la de SBS?