La primera vez que utilicé Random Forest, me dio una precisión del 81% con estos parámetros n_estimadores:10, max_características: sqrt(20), min_samples_split: 2 y min_samples_leaf: 1
Entonces decidí optimizar.
1) He realizado una búsqueda aleatoria. Precisión: 89,76%, n_estimadores: 10, max_features:8, min_samples_split:6, min_samples_leaf:1. Esto tomó 19 minutos.
2) Luego leí que es una buena idea utilizar el error OOB para encontrar los valores óptimos para n_estimadores y max_figuras. Así que lo hice. El gráfico mostró que con menos de 100 árboles el error OOB es alto e inestable. Y que max_features 4 a 10 es bueno.
3) Así que ejecuté una vez más la búsqueda aleatoria. Pero he especificado que hay que buscar árboles de más de 100. Los mejores parámetros son: n_ estimadores: 127, max_features: 7, min_samples_split: 5 y min_samples_leaf: 1. Precisión: 91,56%. ¡¡¡¡¡Tiempo: 6 horas!!!!!
Como puede ver, el aumento de la precisión es de un 3% más. Pero ha tardado 6 horas.
Entonces, ¿merece la pena aumentar el número de árboles (n_estimadores) de 10 a 127?
0 votos
Probablemente deberías utilizar siempre el máximo número de árboles que puedas permitirte, no hay ningún inconveniente fuera del tiempo de entrenamiento.