7 votos

Procesamiento de datos antes de aplicar SVM

Estoy trabajando en la clasificación de archivos de audio. Se trata de una clasificación binaria y tengo el plan de uso de la SVM. He utilizado SVM antes de la cara de contrapartida y otros análisis de la imagen y la recuperación de la materia.

He extraído la función requerida vectores a partir de los archivos de audio, es decir, el entrenamiento y el conjunto de datos de prueba y la reducción de su dimensionalidad mediante Análisis de Componentes Principales. Me gustaría saber si hay más pasos que son necesarios antes de aplicar SVM, la clasificación y la predicción? Debe la prueba y la formación del conjunto de datos obtenidos después de aplicar PCA ser normalizada o en el centro? Sería el resultado sea diferente (mejor / peor) después de la aplicación de la normalización / centerization? O hay más métodos que puede utilizar para pre-procesar los datos antes de SVM se aplica?

7voto

Marc Claesen Puntos 9818

Se aconseja escalar todas las entradas a un intervalo establecido ($[-1,1]$ o$[0,1]$ son opciones populares). De esta forma, no obtendrá ningún sesgo hacia entradas específicas que tengan valores grandes. La escala puede tener un gran efecto en la precisión. Asegúrese de usar los mismos factores de escala en los datos de entrenamiento y prueba.

Para obtener más información, puede echar un vistazo a una guía práctica de la clasificación SVM .

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X