4 votos

Algoritmos de aprendizaje automático embarazosamente paralelos

¿Qué algoritmos de aprendizaje son "vergonzosamente paralelos"? Empezaré con el ejemplo obvio del documentación foreach :

rf <- foreach(ntree = rep(250, 4), .combine = combine, .packages = "randomForest") %dopar%
 randomForest(x, y, ntree = ntree)

¿Qué más hay por ahí que se pueda paralelizar fácilmente con foreach ?

2voto

Boris Tsirelson Puntos 191

El embolsado es vergonzosamente paralelo :

bagging<-function(training,testing,length_divisor=4,iterations=1000)
{
predictions<-foreach(m=1:iterations,.combine=cbind) %do% {
training_positions <- sample(nrow(training), size=floor((nrow(training)/length_divisor)))
train_pos<-1:nrow(training) %in% training_positions
lm_fit<-lm(y~x1+x2+x3,data=training[train_pos,])
predict(lm_fit,newdata=testing)
}
rowMeans(predictions)
}

Código de R, Ruby y Finanzas

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X