A mi entender, muy correlacionadas con las variables de no causar múltiples problemas de multicolinealidad en el azar de bosques modelo (por Favor corríjanme si estoy equivocado). Sin embargo, en la otra forma, si tengo demasiadas variables que contienen información similar, el modelo de peso demasiado, en este conjunto en lugar de los demás?
Por ejemplo, hay dos conjuntos de información (a,B) con el mismo poder predictivo. Variable X1,X2,...X1000 todos contienen la información de Una, y sólo Y contiene la información de B. Cuando el muestreo aleatorio de las variables, en la mayoría de los árboles que crecen en la información de Una, y como resultado de la información B no es totalmente capturado?