14 votos

¿Cuándo se querría usar AdaBoost?

A medida que he escuchado repetidamente sobre el clasificador AdaBoost en el trabajo, quería tener una mejor idea de cómo funciona y cuándo podría ser útil utilizarlo. He leído varios documentos y tutoriales sobre él que encontré en Google, pero hay aspectos del clasificador que todavía me cuesta entender:

  1. La mayoría de tutoriales que he visto mencionan a AdaBoost como la mejor combinación ponderada de varios clasificadores. Esto tiene sentido para mí. Lo que no tiene sentido son las implementaciones (por ejemplo, MALLET) en las que AdaBoost parece aceptar solo un clasificador débil. ¿Cómo tiene sentido esto? Si solo se proporciona un clasificador a AdaBoost, ¿no debería devolver ese mismo clasificador con un peso de 1? ¿Cómo produce nuevos clasificadores a partir del primer clasificador?

  2. ¿Cuándo sería conveniente utilizar AdaBoost en realidad? He leído que se supone que es uno de los mejores clasificadores listos para usar, pero cuando intento potenciar un clasificador MaxEnt con el que obtenía f-scores de más del 70%, AdaBoost lo destruye y me da f-scores de alrededor del 15% con un recall muy alto y una precisión muy baja. Así que ahora estoy confundido. ¿Cuándo querría utilizar AdaBoost? Estoy buscando más una respuesta intuitiva que estrictamente estadística, si es posible.

10voto

karatchov Puntos 230

Adaboost puede usar múltiples instancias del mismo clasificador con diferentes parámetros. Por lo tanto, un clasificador previamente lineal puede combinarse en clasificadores no lineales. O, como les gusta decir a las personas de AdaBoost, múltiples aprendices débiles pueden hacer un aprendiz fuerte. Se puede encontrar una imagen agradable aquí, en la parte inferior.

Básicamente, funciona como cualquier otro algoritmo de aprendizaje: en algunos conjuntos de datos funciona, en otros no. Seguramente hay conjuntos de datos donde destaca. Y quizás aún no has elegido el aprendiz débil correcto. ¿Has probado la regresión logística? ¿Has visualizado cómo evolucionan los límites de decisión al agregar aprendices? Tal vez puedas decir qué está saliendo mal.

0 votos

(+1). Observación adicional: Incluso si los parámetros de los weak learners no difieren, el comportamiento (es decir, lo que predicen) cambia cuando la estructura del conjunto de datos (como se hace en el boosting) cambia.

0 votos

MaxEnt es regresión logística. Visualizar cómo evolucionan los límites de decisión sería realmente útil. ¿Cómo se puede hacer eso? Además, todavía no entiendo cómo AdaBoost sigue funcionando cuando solo se le da un conjunto de características y un tipo de clasificador (como en MALLET). Para mí, esto parece completamente ilógico.

0 votos

Simplemente trace su conjunto de datos. Además, trace una cuadrícula donde elija un color para cada punto según cómo esté siendo clasificado por su sistema. Esto solo funciona bien para 2D, supongo. Todavía podría trazar los ejes más importantes o algo así. Si solo tiene un conjunto de características y un clasificador, se reduce a solo un clasificador. Tenía la impresión de que la entropía máxima era un paradigma y no un clasificador concreto. De todas formas.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X