[Nota: Véase la actualización 1, más abajo]. Me parece que la metodología para rpart
es mucho más fácil de explicar que party
. Sin embargo, esta última es mucho más sofisticada y probablemente dé mejores modelos. La forma en que a veces explico party
es hablar de ella como base para producir modelos lineales locales (o GLM). Para ello, señalo que los resultados de rpart
son constantes en todos los elementos que caen en el nodo hoja, es decir, la caja/región delimitada por las divisiones. Aunque pueda haber mejoras a través de los modelos locales, no se consigue nada más que una predicción constante.
Por el contrario, party
desarrolla las divisiones para optimizar potencialmente los modelos para las regiones. En realidad, utiliza un criterio diferente al de la optimización de los modelos, pero hay que calibrar la propia capacidad de explicar la diferencia para determinar si se puede explicar bien. Los documentos para ello son bastante accesibles para un investigador, pero pueden ser bastante desafiantes para alguien que no esté dispuesto a considerar métodos más simples como bosques aleatorios, boosting, etc. Matemáticamente, creo que party
es más sofisticado... No obstante, los modelos CART son más fáciles de explicar, tanto en lo que respecta a la metodología como a los resultados, y constituyen un buen trampolín para introducir modelos más sofisticados basados en árboles.
En resumen, yo diría que hay que hacer rpart
para mayor claridad, y puede utilizar party
para la precisión / rendimiento, pero no introduciría party
sin introducir rpart
.
Actualización 1. He basado mi respuesta en mi comprensión de party
como hace uno o dos años. Ha crecido bastante, pero modificaría mi respuesta para decir que seguiría recomendando rpart
por su brevedad y legado, debería ser un criterio importante para su cliente/colaborador. Sin embargo, yo trataría de migrar a utilizar más funcionalidades de party
Después de haber presentado a alguien a rpart
. Es mejor empezar por algo pequeño, con funciones de pérdida, criterios de división, etc., en un contexto sencillo, antes de introducir un paquete y una metodología que impliquen conceptos mucho más complicados.