Volver a entrenar el bosque aleatorio con variables importantes

Question

Volver a entrenar el bosque aleatorio con variables importantes

Preguntado el 24 de Julio, 2018: Cuando se hizo la pregunta
363 visitas: Cuantas visitas ha tenido la pregunta
1 Respuestas: Cuantas respuestas ha tenido la pregunta
Resuelta: Estado actual de la pregunta

Tengo un problema de clasificación con unos 2000 predictores. Primero ejecuto un modelo de bosque aleatorio para obtener las variables importantes. A continuación, sólo utilizo esas variables (digamos las 30 más importantes) para volver a ejecutar el modelo. Obtuve una mejora sustancial en la precisión de la validación cruzada y en el AUC. Me pregunto si es una buena práctica y si hay alguna base teórica detrás de esto.

Preguntado el 24 de Julio, 2018 por Xiaoyu Xie

Answer 1

1 Respuestas

Answer 2

1voto

PeterTecks Puntos 36

Se puede considerar una técnica de regularización y, en general, es una gran idea reducir el espacio de características para reducir el sobreajuste. Además, como se utilizan bosques aleatorios, aumentan las posibilidades de que cada árbol individual obtenga alguna característica importante en lugar de una "basura", lo que puede ser importante si no se construye un gran número de árboles. Sin embargo, se trata de un acto de equilibrio y es posible que desee experimentar con el número de características principales que conserva.

Respondido el 24 de Julio, 2018 por PeterTecks (36 Puntos )

Volver a entrenar el bosque aleatorio con variables importantes

Respuesta

Preguntas Destacadas

Etiquetas mas usadas

i-Ciencias.com

Powered by:

Volver a entrenar el bosque aleatorio con variables importantes

Respuesta

Preguntas relacionadas

Preguntas Destacadas

Etiquetas mas usadas

En nuestra red

i-Ciencias.com

Powered by: