Porque randomForest es una colección de independiente carros formados sobre un subconjunto aleatorio de características y registros, se presta a la paralelización. La cosechadora() en función de la randomForest paquete de unir de forma independiente capacitados bosques. Aquí es un juguete ejemplo. Como @mpq 's respuesta por encima de los estados no se debe utilizar la fórmula de la notación, pero pasar en un dataframe/matriz de variables y un vector de resultados. Yo descarada levantado estos de la documentación.
library("doMC")
library("randomForest")
data(iris)
registerDoMC(4) #number of cores on the machine
darkAndScaryForest <- foreach(y=seq(10), .combine=combine ) %dopar% {
set.seed(y) # not really needed
rf <- randomForest(Species ~ ., iris, ntree=50, norm.votes=FALSE)
}
Pasé la randomForest función de combinar a la del mismo nombre .combinar parámetro( que controla la función de la salida del bucle. El lado negativo es que no OOB de la tasa de error o más trágico de importancia variable.
Espero que ayude.
Editar:
Después de releer el post me doy cuenta de que puedo hablar nada sobre el 34+ factor de emisión. Un wholey de la onu-el pensamiento de las respuestas podría ser que los representen, como variables binarias. es decir, a cada factor una columna que está codificado 0/1 -nivel de factor acerca de su presencia/no presencia. Haciendo algunas de selección de variables en importancia los factores y de la eliminación de ellos usted podría tener espacio de características de crecimiento demasiado grande. Sólo un pensamiento.