Tengo una muestra de 12,500 observaciones y 12 variables explicativas. Quiero construir un árbol de decisión de poda, para hacer eso estoy usando la función rpart
y luego la función prune
. Mi problema es que no estoy seguro de cómo construir el árbol completo, estoy usando
rpart(*, *, *, control = (minbucket=x, minsplit=y, cp=z))
# los * son irrelevantes para mi pregunta
para construir el árbol completo, pero no sé qué valores utilizar para x
, y
y z
. Todos los ejemplos que he encontrado tienen muchas menos observaciones en comparación con mi caso.