Necesito un poco de ayuda para entender el concepto de bosques aleatorios. Como yo lo entiendo, cuando hago un árbol de decisión, seleccione cuidadosamente cada uno de los nodos con el fin de maximizar la ganancia de información y minimizar la entropía, yo.e cada nodo debería resultar en una mayor ganancia de información de su nodo padre.
Si esto es cierto, entonces el árbol de decisión es la mejor posible alumno. ¿Por qué tengo que combinarlo con otros árboles que no puede ser tan buena y, a continuación, tomar un voto?
Si he creado el árbol para maximizar la ganancia de información, entonces este ya es el 'mejor modelo'.
Yo entiendo la necesidad de un bosque aleatorio si he creado el 10 de árboles de decisión al seleccionar al azar los nodos dividir.