Yo soy la aplicación de normas de 0-1 escala de características antes de la SVM clasificación de datos financieros, pero los resultados son peores. Este es el resultado antes de escalar
NORMAL DATA AVERAGE RESULTS
Profit PF avMC avPP avRC totTP totFP PF>1 algosnum SS SSl
4389060.90 6.85 -0.00 60.69 0.50 16086 10973 5 8 1 5
y esto es después de escalar
NORMAL DATA AVERAGE RESULTS
Profit PF avMC avPP avRC totTP totFP PF>1 algosnum SS SSl
2256204.80 2044.51 -0.07 52.53 0.46 14577 12220 4 8 1 5
El escalado se realiza en el rango 0-1, los datos de prueba se escala según el factor de escala de los datos del tren. A partir de los resultados anteriores se puede ver que la precisión fue abajo (avPP) de 60.69 a 52.53, el promedio de Mathew Índice de Correlación de 0 a -0.07 número de verdaderos positivos bajó de 16086 a 14577 y el número de falsos positivos crecido de 10973 a 12220. El resultado es un resultado de 80 clasificaciones en los diferentes instrumentos financieros de los datos de 80 conjuntos de datos 20000x200 así que creo que el resultado es muy significativo.
Así que mi pregunta es: En tal situación, ¿cómo debo proceder? Se me atengo a escala? O tal vez debería generar conjunto de datos diferente para comprobar si este comportamiento es coherente? Qué tipo de análisis de mi cuenta que puedo hacer? Mi conjunto de datos es una mezcla de binarios y continuo de características en diferentes escalas.