Quiero intentar utilizar máquinas de vectores soporte (SVM) en mi conjunto de datos. Sin embargo, antes de intentar el problema, me advirtieron de que las SVM no funcionan bien con datos muy desequilibrados. En mi caso, puedo tener hasta un 95-98% de 0 y un 2-5% de 1.
Traté de encontrar recursos que hablaran sobre el uso de SVM en datos dispersos/no equilibrados, pero todo lo que pude encontrar fue 'sparseSVMs' (que utilizan una pequeña cantidad de vectores de soporte).
Esperaba que alguien me lo pudiera explicar brevemente:
- Qué tal funcionaría SVM con un conjunto de datos de este tipo
- ¿Qué modificaciones, en su caso, deben introducirse en el algoritmo SVM?
- ¿Qué recursos/documentos tratan este tema?