14 votos

Bosque al azar: Qué pasa si sé que una variable es importante

Mi entendimiento es el bosque al azar escoge aleatoriamente mtry variables para construir cada árbol de decisión. Así que si mtry = ncol/3 entonces cada variables se usará en promedio en 1/3 de los árboles. Y 2/3 de los árboles no se utilizan.

¿Pero lo que si sé que una sola variable es probablemente muy importante, sería bueno incrementar manualmente la probabilidad de que esta variable se escogió en cada árbol? ¿Es factible con el paquete randomForest en R?

7voto

mathgirl Puntos 31

Tenga en cuenta que mtry es el número de variables en una muestra aleatoria de los candidatos en cada división. Y desde este a los candidatos la mejor es elegido para realizar la división. Así, la proporción que usted menciona no es satisfecha completamente. Más importante que las variables aparecen con más frecuencia, y menos importante – con menos frecuencia. Así que si la variable es realmente muy importante, entonces hay una gran probabilidad de que será recogida en un árbol y no se necesita de una corrección manual. Pero a veces (rara vez) no es una necesidad para la fuerza de la presencia de alguna variable (independientemente de su posible importancia) en la regresión. Que yo sepa paquete de R bosque aleatorio no admite tal posibilidad. Pero si esta variable no tiene intercorrelación con los demás puede hacer la regresión lineal con esta variable como único término y, a continuación, ejecute bosque aleatorio de la regresión en los residuos de esta regresión lineal. Si usted todavía desea corregir la posibilidad de elegir preespecificado variables, luego de la modificación de código fuente, con la siguiente compilación es tu opción.

6voto

Desde junio de 2015, un nuevo algoritmo de RF prometedor en R-CRAN llamado 'ranger' tiene esta característica. Es compatible con split.select.weights: "Numérico vector con pesos entre 0 y 1, que representa la probabilidad de seleccionar variables para dividir".

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X