9 votos

Estadística estructura de directorios del proyecto con varios idiomas (por ejemplo, R y Splus)?

Edificio en el post Cómo gestionar de forma eficiente un análisis estadístico del proyecto y el ProjectTemplate paquete en R...

P: ¿Cómo construir su proyecto estadístico estructura de directorios cuando varios idiomas característica fuertemente (e.g, R Y Splus)?

La mayoría de los debates sobre este tema se han limitado a los proyectos que principalmente el uso de un idioma. Estoy preocupado por cómo reducir al mínimo descuido, la confusión, y la rotura, cuando el uso de varios idiomas.

He incluido a continuación de mi proyecto actual estructura y métodos para hacer las cosas. Una alternativa podría ser la de separar el código para que me ./R y ./Splus directorios---cada uno con sus propios /lib, /src, /util, /testsy /munge directorios.

P: Cual es el método sería el más cercano a las "mejores prácticas" (si existe alguno)?

  • /datos - datos compartidos a través de proyectos
  • /bibliotecas - scripts compartido a través de los proyectos de
  • /proyectos/miproyecto - mi directorio de trabajo. En la actualidad, si puedo usar varios idiomas comparten este lugar como su directorio de trabajo.
  • ./datos/ datos específicos de la /myproject y simbólicos de datos en /data
  • ./cache/ - en caché de los espacios de trabajo (por ejemplo, .RData archivos guardados mediante save.image() R + o .sdd archivos guardados mediante data.dump() en Splus)
  • ./lib/ - principales archivos de proyecto. Mismo en todos los proyectos. R proyecto se ejecutará a través de source("./lib/main.R") que a su vez ejecuta load.R, clean.R, test.R, analyze.R, .report.R. En la actualidad, si hay varios idiomas que se utilizan, dicen, Splus, además de a R, voy a lanzar main.ssc, clean.ssc, etc. en este directorio también. No estoy seguro de que como este aunque.
  • ./src/ - proyecto-funciones específicas. Recogida una función por cada archivo.
  • ./util/ general funciones con el tiempo a ser empaquetados. Recogida una función por cada archivo.
  • ./pruebas/ archivos para la ejecución de casos de prueba. Utilizado por ./lib/test.R
  • ./munge/ archivos para la limpieza de datos. Utilizado por ./lib/clean.R
  • ./figuras/ tablas y la figura de la salida de ./lib/report.R para ser utilizado en el informe final
  • ./informe/ - .tex archivos y enlaces simbólicos a los archivos en ./figures
  • ./presentación/ - .tex archivos de presentaciones (generalmente de la Beamer de la clase)
  • ./temp/ - ubicación temporal de secuencias de comandos
  • ./LÉAME
  • ./TODO
  • ./.RData - para el almacenamiento de R áreas de trabajo del proyecto
  • ./.Datos/ - para almacenar S áreas de trabajo del proyecto

3voto

Bryan Rehbein Puntos 3947

Definitivamente yo no lo llamaría "mejores prácticas", pero mi típico proyecto ha directorios

R (que contiene, en general, prepData.R, analysis.R, func.Ry figs.R, aunque podría ser que estas podrían ser cada uno dividido en muchos archivos y podría utilizar Sweave o asciidoc)

Perl (principalmente para análisis/de la conversión de archivos de datos)

RawData (todos los archivos de datos originales)

Data (todos los archivos procesados)

Notes (en general, las notas de la colaboradora)

El R directorio a menudo contiene los subdirectorios Figs y Rcache.

De particular importancia: el control de versión! Me gusta git.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X