21 votos

Es la construcción de un multiclase clasificador mejor que varios binario?

Necesito clasificar las direcciones Url en categorías. Decir que tengo 15 categorías que estoy planeando a cero abajo de cada URL.

Es un 15-modo clasificador mejor? Donde tengo 15 etiquetas y generar las características de cada punto de datos.

O la construcción de 15 clasificadores binarios, decir: Película o No la Película, y el uso de los números que obtenemos de estas clasificaciones para construir un ranker, para elegir la mejor categoría, va a ser mejor?

12voto

ESRogs Puntos 1381

Primero de todos, usted debe preguntarse si su problema es multilabel (es decir, una única dirección URL puede pertenecer a varias clases) o no (es decir, una única dirección URL puede pertenecer a una sola clase).

En el primer caso, ir con una batería de clasificadores binarios, porque se trata de un defecto de forma de hacer multilabel problemas.

En el segundo caso, la respuesta depende de una combinación de cómo hace sus datos mirada, ¿cuál es el objetivo de su análisis y ¿cuál es el método que están utilizando, probablemente, sólo debe probar ambos y seleccionar las mejores.
Sólo tenga en cuenta que algunos métodos (como la SVM) en realidad no se hacen multiclase clasificación por la forma en que se definen y por lo tanto internamente el uso de una batería de clasificadores binarios.

4voto

mat_geek Puntos 1367

Esto dependerá de cómo sus datos se dispersa. Hay un hermoso ejemplo de que fue dado recientemente a una pregunta similar, donde el OP quería saber si una sola lineal de la función discriminante sería una mejor clasificador para decidir población a vs B o C, o uno basado en múltiples discriminante lineal de funciones que separan a ,B y C. Algunos uno de ellos le dio un muy bonito color diagrama de dispersión para mostrar cómo el uso de dos discriminantes sería mejor que uno en ese caso. Voy a tratar de poner el enlace.

1voto

Jasmine D Puntos 1

Algunos de los métodos de lidiar bien con multiclase, Bosques Aleatorios, MLPs por ejemplo.

Si usted no quiere ir por ese camino, entonces es posible que la CEC puede bien realizar 1-vs-Todo para tu problema, sólo prueba lo dirá.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X