El SMOTE para el desequilibrio debe aplicarse sólo para los datos de entrenamiento, ¿verdad? ¿Podemos seguir haciéndolo (realizar el SMOTE en los datos de entrenamiento) mientras seleccionamos el CV k-fold y no vamos a dividir los datos en conjuntos separados de entrenamiento y prueba? He leído en alguna parte que debemos separar los datos de entrenamiento ( aplicar el SMOTE) y luego ejecutar el clasificador en unos datos de prueba separados.
Respuesta
¿Demasiados anuncios?
roberto
Puntos
1