Esta es una pregunta en general, no específica a cualquier método o conjunto de datos. ¿Cómo debemos tratar con una clase de problema de desequilibrio en la supervisión de la Máquina de aprendizaje, donde el número de 0 a alrededor de 90% y el número 1 es de alrededor de 10% en el conjunto de datos.Cómo podemos hacer de manera óptima entrenar el clasificador.
Una de las maneras en que sigo es la de muestreo para realizar el equilibrado conjunto de datos y, a continuación, entrenar el clasificador y repita este paso para muestras múltiples.
Yo siento que esto es aleatorio, Es allí cualquier marco de abordaje de este tipo de problemas.