8 votos

¿Debe evitarse la poda para el ensacado (con árboles de decisión)?

Vine por varios mensajes y documentos alegando que podando árboles en un conjunto de "empaquetamiento" de árboles no es necesario (ver 1).

¿Sin embargo, es necesariamente (o al menos en algunos casos conocidos) perjudicial para realizar la poda (digamos, con la muestra OOB) en los árboles individuales en un conjunto?

¡Gracias!

6voto

VarLogRant Puntos 284

Tal,

Hablando en general, la poda va a perjudicar el rendimiento de bolsas de árboles.

Los árboles son inestables clasificadores; lo que significa que si se perturba los datos un poco el árbol podría cambiar significativamente. Son de bajo nivel de sesgo, pero de alta varianza de los modelos. Embolsado en general obras de "replicar" el modelo de la unidad de la varianza de abajo (a la antigua "para aumentar su tamaño de la muestra" truco).

Sin embargo, si al final promedio de los modelos que son muy similares, entonces usted no gana mucho. Si los árboles son unpruned, tienden a ser más diferentes el uno del otro que si se podan. Esto tiene el efecto de "decorrelating" los árboles por lo que son un promedio de los árboles que no son demasiado similares. Esta es también la razón por la que los bosques aleatorios agregar el tweak del azar predictor de selección. Que coacciona a los árboles a ser muy diferente.

El uso de unpruned árboles aumentará el riesgo de overfiting, pero el modelo promedio de más de compensaciones de esto (hablando en general).

HTH,

Max

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X