Respecto a lo que es reproducible, la mejor manera es proporcionar reproducible de investigación (es decir, de código y de datos) junto con el papel. Hacer que esté disponible en su sitio web, o en un sitio de alojamiento (como github).
Con respecto a la visualización, Leo Breiman ha hecho algún trabajo interesante en este sentido (ver su página web, en particular la sección gráficos).
Pero si usted está utilizando R, entonces el randomForest
paquete tiene algunas funciones útiles:
data(mtcars)
mtcars.rf <- randomForest(mpg ~ ., data=mtcars, ntree=1000, keep.forest=FALSE,
importance=TRUE)
plot(mtcars.rf, log="y")
varImpPlot(mtcars.rf)
Y
set.seed(1)
data(iris)
iris.rf <- randomForest(Species ~ ., iris, proximity=TRUE,
keep.forest=FALSE)
MDSplot(iris.rf, iris$Species)
No estoy al tanto de una manera sencilla, en realidad la trama de un árbol, pero puede utilizar el getTree
función para recuperar el árbol y la trama que por separado.
getTree(randomForest(iris[,-5], iris[,5], ntree=10), 3, labelVar=TRUE)
El Strobl/Zeileis presentación sobre "por Qué y cómo utilizar bosque aleatorio de la variable importancia de las medidas (y cómo no)" tiene ejemplos de árboles que deben haber sido producidos de esta manera. Esta entrada en el blog sobre modelos de árbol tiene algunos buenos ejemplos de CARRITO de parcelas de árboles que se puede utilizar por ejemplo.
Como @chl comentado, un solo árbol no es especialmente significativo en este contexto, por lo corto de su uso para explicar lo que es un bosque aleatorio es, yo no incluir esto en un papel.