Ya hay algunas buenas respuestas en la gestión del proyecto (por ejemplo. Cómo gestionar de forma eficiente un análisis estadístico proyecto?). Estas son grandes, y hacen la vida mucho más fácil. En particular, el flujo de trabajo que corre a lo largo de las líneas de
- Carga de datos en bruto.
- Manipular los datos en bruto en formas útiles. (Descarga de datos en bruto para ahorrar espacio).
- Realizar análisis y almacenar los resultados.
- Hacer y almacenar las cifras.
Una cosa que es todavía difícil es conseguir a partir de datos en bruto a la final de los resultados y cifras, sin tener que ejecutar todo el proyecto desde cero cada vez que algo cambia. Lo que me gustaría ser capaz de hacer es algo como esto:
- Intento de crear la figura. Manipulación de datos está disponible en la memoria?
- Sí: crear la figura.
- No: No manipular los datos que existen en el disco?
- Sí: Carga de manipular los datos.
- No: Carga de datos sin procesar, manipular y guardar, luego de descargar los datos en bruto de los objetos.
También, en cada paso que sería bueno tener algún desencadenante para forzar una completa re-carga, si el crudo de datos ha sido actualizada.
Hay un marco existente en R para hacer algo como esto? O hay alguna manera recomendada de hacerlo? Tal y como está, a menudo tengo que ejecutar todo desde cero, lo cual puede tardar años (de grandes archivos de datos, manipulaciones complejas), y es un desperdicio de recursos