Siguiendo las mejores prácticas de ML, utilizo Scikit Pipelines para asegurarme de que el preprocesamiento de mis datos es el mismo en cada iteración de desarrollo del modelo.
Además, como mejor práctica, una vez que he completado el desarrollo del modelo, vuelvo a entrenar el mejor modelo con los hiperparámetros elegidos en todo el conjunto de datos.
Ahora, para preparar un despliegue a producción, estoy tratando de entender si debo exportar el modelo elegido en sí mismo, o todo el objeto Pipeline? Querría aplicar exactamente los mismos pasos de preprocesamiento en producción, ¿correcto?