El valor predeterminado/valor recomendado de mtry es P/3 para la regresión de la tarea, mientras que es SquareRoot(P) para una tarea de clasificación. (donde P es el número de variables)
Según mi comprensión de la idea fundamental detrás de RF está utilizando más pequeño subconjunto de variables en el Bosque Aleatorio es crear débil y diversos clasificadores y agregarlas a uno más fuerte clasificador.
Pero no pude encontrar ninguna documentación específica sobre el por qué de una regresión de la tarea tiene un valor predeterminado de P/3 en lugar de SquareRoot(P).
Es algo específico de Bosque Aleatorio?Si es así ¿qué es?
O
Es más fundamentales como la diferencia entre el rendimiento/construcción de regresión y clasificación de los árboles que dicta RF.
No estoy buscando una completa simplificado respuesta, sólo me apunte a la derecha de la literatura enlaces :)
Gracias!