Encontré estas frases:
El PCA antes del bosque aleatorio puede ser útil no para reducir la dimensionalidad dimensionalidad, sino para dar a los datos una forma en la que el bosque aleatorio puede mejor.
Estoy seguro de que, en general, si transformas tus datos con PCA manteniendo la misma dimensionalidad de los datos originales tendrás una mejor clasificación con random forest
de esta página: ¿PCA en datos de texto de alta dimensión antes de la clasificación de bosque aleatorio?
En mi caso encontré que esto es realmente cierto para un problema de regresión con una base de datos de ~1M de registros y 25 predictores. El sitio web El error disminuye en un 10% aproximadamente si utilizo los 25 PCA como predictores en lugar de los 25 predictores originales.
¿Puede alguien ayudarme a entender e interpretar claramente este resultado?
1 votos
En muchos casos, el PCA antes del método supervisado no es recomendable, porque el PCA no tiene en cuenta la variable de respuesta. Pero mantener el mismo número de características, aumentará el rendimiento? buena pregunta..
1 votos
El bosque aleatorio es invariable a la escala, por lo que toda la acción aquí tendría que venir de la rotación y la reflexión en la transformación lineal generada por PCA? ¿Prefiere el bosque aleatorio que (1) algunas características sean extremadamente predictivas mientras que otras son totalmente inútiles en comparación con (2) que todas las características sean algo predictivas?