He de datos con unos pocos miles de características y quiero hacer la función recursiva de selección (RFE) para quitar de valor informativo. Puedo hacer esto con el símbolo de intercalación y la RFE. Sin embargo, empecé a pensar, si quiero conseguir el mejor ajuste de regresión (random forest, por ejemplo), cuando debo realizar parámetro de sintonización (mtry
de RF)? Que es, como yo lo entiendo símbolo de intercalación de los trenes de RF repetidamente en las diferentes característica de subconjuntos con un fijo mtry. Supongo que el óptimo mtry
debe ser encontrados después de la selección de características es terminado, pero el mtry
valor que el símbolo de intercalación utiliza influir en el subconjunto seleccionado de características? Mediante el símbolo de intercalación con baja mtry
es mucho más rápido, por supuesto.
Espero que alguien pueda explicar esto a mí.