El randomForest aplicación no permite un muestreo más allá del número de observaciones, incluso cuando el muestreo con reemplazo. ¿Por qué es esto?
Funciona bien:
rf <- randomForest(Species ~ ., iris, sampsize=c(1, 1, 1), replace=TRUE)
rf <- randomForest(Species ~ ., iris, sampsize=3, replace=TRUE)
Lo que quiero hacer:
rf <- randomForest(Species ~ ., iris, sampsize=c(51, 1, 1), replace=TRUE)
Error in randomForest.default(m, y, ...) :
sampsize can not be larger than class frequency
De error Similar sin muestreo estratificado:
rf <- randomForest(Species ~ ., iris, sampsize=151, replace=TRUE)
Error in randomForest.default(m, y, ...) : sampsize too large
Desde que yo estaba esperando el método para tomar muestras bootstrap cuando se administra replace=TRUE en ambos casos, no me esperaba este límite.
Mi objetivo es utilizar esta con el muestreo estratificado opción, con el fin de sacar una suficientemente amplia muestra de una forma relativamente rara de la clase.