Estoy desconcertado por qué el paquete de caret en R no permite afinar el número de árboles (ntree) en un bosque al azar (específicamente en el paquete randomForest )? No puedo imaginar que esto es un descuido por parte del autor del paquete - así que debe haber una razón para ello? ¿Puede alguien arrojar luz?
Respuesta
¿Demasiados anuncios?En teoría, el rendimiento de un modelo RF debe ser una función monotónica de ntree que mesetas más allá de un cierto punto una vez de tener "suficiente" de los árboles. Esto hace que ntree más de un parámetro de rendimiento de un ricitos de oro parámetro que se desea optimizar. Símbolo de intercalación tiende a concentrarse en la optimización de los parámetros que funcionan mal para valores altos y bajos en los que desea encontrar el término medio.
En la práctica yo creo que puede haber habido estudios que han encontrado que el rendimiento se reduce muy grandes ntree valores, pero incluso si esto es cierto, el efecto es sutil y requiere muy grandes bosques.
Hay al menos 2-3 otros parámetros de RF que el Cursor no sintoniza por las mismas razones que ntree.