¿Deben ser todas las muestras de entrenamiento ejemplos positivos o no?
Sí, en una clase SVM (y cualquier otro algoritmo de detección de valores atípicos) sólo necesita un clase. Si es positivo o negativo depende de su convención de nomenclatura, pero lo más probable es que busque positivo ejemplos poco representados.
¿Qué función kernel puede obtener mejores resultados, el kernel lineal o el kernel RBF?
"No hay almuerzo gratis". No hay una respuesta general, la razón de tener muchos núcleos (no sólo lineal y rbf) es que funcionan bien en diferentes aplicaciones. Es dependiente de los datos decisión, por lo que tendrá que probar al menos esas dos.
¿Cuál es el efecto de los valores de nu en el modelo?
Corresponde a los límites de la fracción de puntos que se convierten en vectores de soporte, por lo que limita la complejidad del modelo (cuanto menor sea el número de SV, más sencillo será el modelo y menos propenso al sobreajuste, aunque también al infraajuste). Como en el http://www.cms.livjm.ac.uk/library/archive/Grid%20Computing/NoveltyDetection/sch00support.pdf papel, corresponde directamente a:
- "un límite superior en la fracción de valores atípicos"
- "un límite inferior a la fracción de SV".