Contexto:
Recientemente he adoptado el control de versiones como parte de mi trabajo de análisis de datos (finalmente puedo escucharte decir: mira mi pregunta anterior en SO). Esto me hizo pensar más en los repositorios y la estructura de directorios que uso para mis proyectos.
Mi trabajo de investigación típico implica uno o más estudios (es decir, datos que he recopilado) que se redactan en una o varias publicaciones (artículos de revistas, capítulos de libros, presentaciones, informes, etc.). Los análisis e informes suelen producirse utilizando una combinación de R, LaTeX, Sweave, archivos de datos de texto, etc. Me gusta mucho la idea de poder subir un único repositorio autocontenido que se pueda utilizar para analizar los datos y reproducir una publicación.
En particular, he estado pensando en publicaciones, estudios, datos y código común, y cómo se relacionan estas entidades con los repositorios. Por ejemplo, ¿es mejor tener un repositorio separado para cada publicación o es mejor tener cada publicación como una carpeta individual dentro de un repositorio más grande? Estoy desarrollando algunas ideas al respecto, pero estaba ansioso por escuchar otras opciones.
Pregunta:
- ¿Qué estrategias utilizan las personas para relacionar estudios, publicaciones y análisis en los repositorios?
- ¿Cuándo deberían dividirse en múltiples repositorios entidades relacionadas (por ejemplo, publicaciones, estudios, etc.)?