Reducir al Azar Bosque modelo tamaño de la memoria

Question

Reducir al Azar Bosque modelo tamaño de la memoria

Preguntado el 9 de Junio, 2014: Cuando se hizo la pregunta
613 visitas: Cuantas visitas ha tenido la pregunta
1 Respuestas: Cuantas respuestas ha tenido la pregunta
Abierta: Estado actual de la pregunta

He creado un modelo de regresión en mis datos con bosques aleatorios en R. El resultado es bastante grande, me pregunto si hay alguna manera de reducir sólo a las piezas necesarias para hacer una predicción?

El conjunto de datos de entrenamiento contiene 20 variables y ~45,000 filas, que también es grande. Mi código se enumeran a continuación.

data <- readRDS("data.Rds")

require("data.table")
require("doParallel")
require("randomForest")

train <- data[ which(set == "train")]
test <- data[ which(set == "test")]
rm(data)

x <- data.table(train[, 2:21, with=FALSE])
y <- as.vector(as.matrix(train[, 23, with=FALSE]))

cl <- makeCluster(detectCores())
registerDoParallel(cl, cores=4)
time <- system.time({rf.fit <- foreach(ntree=rep(500, 6),
                               .combine=combine,
                               .multicombine=TRUE,
                               .packages="randomForest") %dopar% 
                   {randomForest(x, y, ntree=ntree)}})
stopCluster(cl)

saveRDS(rf.fit, "rf.fit.Rds")

El resultado de esto es ~230 MB. Una vez que tengo el modelo, es posible reducir el tamaño para que sea más fácil trabajar con? Mis objetivos con este son identificar las variables más importantes, y hacer una predicción sobre nuevos datos.

Preguntado el 9 de Junio, 2014 por Boris Breuer

Answer 1

1 Respuestas

Answer 2

3voto

ReKa Puntos 11

He utilizado esta función para reducir mi símbolo de intercalación predeterminada de salida de 137 MB a 3 MB. Usted puede usar este modelo para la predicción con $finalModel

## Clean Model to Save Memory

## http://stats.stackexchange.com/questions/102667/reduce-random-forest-model-memory-size
stripRF <- function(cm) {
  cm$finalModel$predicted <- NULL 
  cm$finalModel$oob.times <- NULL 
  cm$finalModel$y <- NULL
  cm$finalModel$votes <- NULL
  cm$control$indexOut <- NULL
  cm$control$index    <- NULL
  cm$trainingData <- NULL

  attr(cm$terms,".Environment") <- c()
  attr(cm$formula,".Environment") <- c()

  cm
}

Respondido el 4 de Septiembre, 2015 por ReKa (11 Puntos )

Reducir al Azar Bosque modelo tamaño de la memoria

Respuesta

Preguntas Destacadas

Etiquetas mas usadas

i-Ciencias.com

Powered by:

Reducir al Azar Bosque modelo tamaño de la memoria

Respuesta

Preguntas relacionadas

Preguntas Destacadas

Etiquetas mas usadas

En nuestra red

i-Ciencias.com

Powered by: