1 votos

¿Podemos aplicar SMOTE a datos con k-fold CV?

El SMOTE para el desequilibrio debe aplicarse sólo para los datos de entrenamiento, ¿verdad? ¿Podemos seguir haciéndolo (realizar el SMOTE en los datos de entrenamiento) mientras seleccionamos el CV k-fold y no vamos a dividir los datos en conjuntos separados de entrenamiento y prueba? He leído en alguna parte que debemos separar los datos de entrenamiento ( aplicar el SMOTE) y luego ejecutar el clasificador en unos datos de prueba separados.

1voto

roberto Puntos 1

Aplicas SMOTE sólo en su conjunto de entrenamiento, construya su modelo en él, y luego pruébelo en el conjunto de prueba sin modificar.

En CV, esto se haría aplicando SMOTE en sus k-1 pliegues, construyendo su modelo en ellos y probándolo en el pliegue restante sin SMOTE.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X