¿Cuál es la influencia de C en las SVM con núcleo lineal?

Question

¿Cuál es la influencia de C en las SVM con núcleo lineal?

Preguntado el 23 de Junio, 2012: Cuando se hizo la pregunta
29014 visitas: Cuantas visitas ha tenido la pregunta
3 Respuestas: Cuantas respuestas ha tenido la pregunta
Resuelta: Estado actual de la pregunta

Actualmente estoy utilizando una SVM con un núcleo lineal para clasificar mis datos. No hay ningún error en el conjunto de entrenamiento. He probado varios valores para el parámetro $C$ ( $10^{-5}, \dots, 10^2$ ). Esto no cambió el error en el conjunto de pruebas.

Ahora me me pregunto: ¿es un error causada por las fijaciones de rubí para libsvm Estoy usando ( rb-libsvm ) o se trata de teóricamente explicable ?

En caso de que el parámetro $C$ ¿se modifica siempre el rendimiento del clasificador?

Preguntado el 23 de Junio, 2012 por AlanBarber

0 votos

Sólo un comentario, no una respuesta: Cualquier programa que minimiza una suma de dos términos, como $|w|^2 + C \sum{ \xi_i },$ debería (en mi opinión) decirte cuáles son los dos términos al final, para que puedas ver cómo se equilibran. (Si necesita ayuda para calcular usted mismo los dos términos de la SVM, intente hacer una pregunta aparte. ¿Ha mirado algunos de los puntos peor clasificados? ¿Podría publicar un problema similar al suyo?)

Comentado el 13 de Julio, 2012 por MattSayar

Answer 1

3 Respuestas

Answer 2

6voto

user133311 Puntos 56

Las respuestas anteriores son excelentes. Después de leer detenidamente sus preguntas, he descubierto que hay 2 hechos importantes que podríamos pasar por alto.

Está utilizando un núcleo lineal
Sus datos de entrenamiento son linealmente separables, ya que "No hay error en el conjunto de entrenamiento".

Dados los 2 hechos, si los valores de C cambian dentro de un rango razonable, el hiperplano óptimo sólo se desplazará aleatoriamente por una pequeña cantidad dentro del margen (la brecha formada por los vectores de soporte).

Intuitivamente, supongamos que el margen de los datos de entrenamiento es pequeño, y/o que no hay puntos de datos de prueba dentro del margen también, el desplazamiento del hiperplano óptimo dentro del margen no afectará al error de clasificación del conjunto de pruebas.

No obstante, si establece C=0, la SVM ignorará los errores y sólo tratará de minimizar la suma de los cuadrados de los pesos (w), tal vez obtenga resultados diferentes en el conjunto de pruebas.

Respondido el 3 de Octubre, 2016 por user133311 (56 Puntos )

Answer 3

3voto

H. Irshad Puntos 31

El parámetro C se utiliza para controlar los valores atípicos: un valor bajo de C implica que estamos permitiendo más valores atípicos, un valor alto de C implica que estamos permitiendo menos valores atípicos.

Respondido el 3 de Marzo, 2019 por H. Irshad (31 Puntos )

Answer 4

1voto

Amit Dhall Puntos 231

Un C (coste) alto significa que el coste de la clasificación errónea aumenta. Esto significa que un kernel flexible se volverá más cuadriculado para evitar la clasificación errónea de las observaciones en el conjunto de entrenamiento.

Si el núcleo es para squiggly el modelo no se generalizará bien al predecir sobre nuevos datos.

Si el núcleo es para recta el modelo no se generalizará bien al predecir sobre nuevos datos.

Respondido el 10 de Mayo, 2019 por Amit Dhall (231 Puntos )

¿Cuál es la influencia de C en las SVM con núcleo lineal?

Respuestas

Preguntas Destacadas

Etiquetas mas usadas

i-Ciencias.com

Powered by:

¿Cuál es la influencia de C en las SVM con núcleo lineal?

Respuestas

Preguntas relacionadas

Preguntas Destacadas

Etiquetas mas usadas

En nuestra red

i-Ciencias.com

Powered by: