12 votos

Con selección y parámetro sintonía con intercalación de bosque aleatorio

He de datos con unos pocos miles de características y quiero hacer la función recursiva de selección (RFE) para quitar de valor informativo. Puedo hacer esto con el símbolo de intercalación y la RFE. Sin embargo, empecé a pensar, si quiero conseguir el mejor ajuste de regresión (random forest, por ejemplo), cuando debo realizar parámetro de sintonización (mtry de RF)? Que es, como yo lo entiendo símbolo de intercalación de los trenes de RF repetidamente en las diferentes característica de subconjuntos con un fijo mtry. Supongo que el óptimo mtry debe ser encontrados después de la selección de características es terminado, pero el mtry valor que el símbolo de intercalación utiliza influir en el subconjunto seleccionado de características? Mediante el símbolo de intercalación con baja mtry es mucho más rápido, por supuesto.

Espero que alguien pueda explicar esto a mí.

12voto

Tom.Rampley Puntos 38

Una cosa que usted puede desear mirar en regularizadas al azar de los bosques, que están diseñados específicamente para la selección de características. Este documento explica el concepto, y cómo se diferencian de las normales bosques aleatorios

La Selección de características a través de la Regularización de los Árboles

También hay un CRAN paquete FRR que construir en el randomForest que permite implementar fácilmente en R. he tenido buena suerte con esta metodología de mí mismo.

Respecto a su pregunta inicial, el único consejo que puedo dar es que si usted tiene un montón de colinealidad, entonces usted necesita utilizar más pequeño árbol de tamaños. Esto permite que el algoritmo para determinar la importancia con menos interferencia de colinealidad efectos.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X