A menudo me encuentro entrenando varios modelos predictivos diferentes utilizando caret
en R. Los entrenaré a todos en los mismos pliegues de validación cruzada, usando caret::: createFolds
y, a continuación, elija el mejor modelo basándose en el error de validación cruzada.
Sin embargo, la predicción media de varios modelos suele superar al mejor modelo individual en un conjunto de pruebas independiente. Estoy pensando en escribir algunas funciones para apilar/ensamblar modelos caret que fueron entrenados con los mismos pliegues de validación cruzada, por ejemplo tomando la mediana de las predicciones de cada modelo en cada pliegue, o entrenando un "meta-modelo".
Por supuesto, esto podría requerir un bucle externo de validación cruzada. ¿Alguien conoce algún paquete o código fuente abierto para ensamblar modelos de caret (y posiblemente para validar de forma cruzada esos ensamblajes)?