3 votos

¿Cómo documentar un resultado de Random Forest (modelo final)?

Usando Random Forest para predecir variables dicotómicas (para clasificación), encontré el problema de cómo documentar mejor este modelo, es decir, quiero que el usuario reproduzca/use el modelo final que creé en mi computadora. Por ejemplo, supongamos que quiero difundir el modelo (que creé en R) en una publicación o a otros, ¿cómo haría esto?

Ejemplo mínimo (MWE): Si quiero documentar este modelo, ¿cómo puedo hacerlo (sin incluir los datos)?

data(iris)
iris.rf <- randomForest(Species ~ ., data=iris, importance=TRUE,
                          proximity=TRUE)

¿Cómo puedo incluir el modelo iris.rf en una publicación para que otros puedan usarlo para predecir Species con nuevos datos?

Estoy buscando una forma de hacer que un bosque sea reproducible para el lector/usuario (sin tener necesariamente los datos que se utilizaron para crear el bosque). Me preguntaba si hay otras formas de publicar un RF sin agregar los datos fuente.

2voto

Loren Pechtel Puntos 2212

Un bosque aleatorio es una colección de árboles de decisión. Entonces tienes una colección de, digamos, 500 modelos de árboles de decisión que votan en la respuesta final y ninguno de estos modelos se puede describir de manera más concisa que los propios árboles de decisión. Así que estás de mala suerte si quieres un resumen conciso de tu modelo de RF.

Puedes hablar sobre la capacidad predictiva, puedes usar estadísticas de importancia de variables del RF, que pueden estar sesgadas en el caso de variables categóricas y puedes dibujar bonitas imágenes, pero eso es todo.

Puedes apartar tu RF y considerarlo (importancia de variables, etc.) como una herramienta exploratoria que luego utilizas para hacer una regresión logística. Entonces tendrás un resultado bastante compacto: un glm que es muy parecido a lm, por supuesto.

Oh, otros han hecho preguntas similares antes:

La mejor manera de presentar un bosque aleatorio en una publicación

https://stackoverflow.com/questions/14996619/random-forest-output-interpretation

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X