13 votos

¿Hay aplicaciones en las que SVM sigue siendo superior?

El algoritmo SVM es bastante antiguo: se desarrolló en la década de 1960, pero fue muy popular en las décadas de 1990 y 2000. Es una parte clásica (y bastante bonita) de los cursos de aprendizaje automático.

Hoy parece que en el tratamiento de medios (imágenes, sonido, etc.) dominan por completo las redes neuronales, mientras que en otras áreas el Gradient Boosting ocupa posiciones muy fuertes.

Además, en concursos de datos recientes no observo soluciones basadas en SVM.

Busco ejemplos de aplicaciones en las que SVM siga dando resultados de última generación (a fecha de 2016).

Actualización: Me gustaría tener algún ejemplo que pueda dar, por ejemplo, a estudiantes / colegas cuando explique SVM para que no parezca un enfoque puramente teórico o obsoleto.

3 votos

¿Superior en qué sentido? ¿Alguna métrica de rendimiento? Entrenar una red neuronal profunda requiere mucho tiempo de ordenador, pero puedo entrenar una SVM útil en mi portátil.

0 votos

@user777 Me refiero a la clasificación / regresión métrica adecuada para el campo de aplicación, por supuesto. El tema de la complejidad computacional para DL es importante, pero se sale un poco del ámbito de esta pregunta.

12voto

BillyJean Puntos 118

Según el documento ¿Necesitamos cientos de clasificadores para resolver problemas de clasificación del mundo real? SVM, junto con Random Forest y Gradient Booting Machines, se encuentran entre los algoritmos de clasificación de mayor rendimiento para un gran conjunto de más de 120 conjuntos de datos (utilizando la precisión como métrica).

Repetí sus experimentos con algunas modificaciones y consigo que estos tres clasificadores rindan mejor que los otros, pero como el teorema del almuerzo gratis dice que siempre hay algún problema en el que algún otro algoritmo funciona mejor que estos tres.

Así que sí, yo diría que SVM (con kernel gaussiano - que es lo que he utilizado) sigue siendo un algoritmo relevante para los conjuntos de datos no relacionados con los medios de comunicación.

0 votos

Hola, ¡gracias por la respuesta! He visto este interesante estudio. Por lo que yo entiendo, la idea era ver cuánto clasificador da sin ningún ajuste serio (mientras que el analista de datos. debe realizar el tuning IMO). Un estudio relacionado con la zona sería más interesante.

1 votos

Recuerdo que Delgado et all no realizaron una búsqueda muy detallada de los mejores hiperparámetros, pero si realizaron alguna búsqueda. La pregunta (para la que no tengo respuesta) es si una búsqueda más detallada de los mejores hiperparámetros daría lugar a resultados diferentes. Si eso es cierto, significaría que los algoritmos que compiten con SVM tienen en general un pico muy agudo en la precisión para determinados hiperparámetros, lo que creo que es un factor negativo para el algoritmo.

0 votos

Otro comentario menor es que los conjuntos de datos de la UCI (utilizados para las pruebas) son en su mayoría bastante pequeños. Me pregunto si esto podría ser la explicación de los pobres resultados de boosting. La mayoría de los desafíos kaggle (con muchos datos) demuestran el rendimiento superior de GB.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X