23 votos

¿Cuáles son las maneras eficientes de organizar código R y de salida?

Estoy buscando la entrada en cómo otros organizar su código R y de salida.

Mi práctica actual consiste en escribir el código de los bloques en un archivo de texto como tal:

#=================================================
# 19 May 2011
date()
# Correlation analysis of variables in sed summary
load("/media/working/working_files/R_working/sed_OM_survey.RData")
# correlation between estimated surface and mean perc.OM in epi samples
cor.test(survey$mean.perc.OM[survey$Depth == "epi"], 
    survey$est.surf.OM[survey$Depth   == "epi"]))
#==================================================

Yo, a continuación, pegar el resultado en otro archivo de texto, por lo general con alguna anotación.

Los problemas con este método son:

1) El código y la salida no están explícitamente vinculados a otros que por la fecha.

2) El código de salida y están organizados cronológicamente y por lo tanto puede ser difícil de búsqueda.

He pensado en hacer una Sweave documento con todo lo que desde entonces yo podría hacer una tabla de contenidos, pero en este parece que puede ser más problemas que los beneficios que provee.

Por favor, hágamelo saber de efectivo de las rutinas que tienen para la organización de su código R y de salida que permita una búsqueda eficiente de edición y el análisis.

23voto

Brett Veenstra Puntos 10238

6voto

Oddthinking Puntos 182

Yo por organizar todo en 4 archivos para cada proyecto o análisis. (1) 'código' de Donde puedo almacenar archivos de texto de R funciones. (2) 'sql' Donde guardo las consultas utilizadas para recopilar los datos de mi. (3) " dat " Donde guardo las copias (generalmente csv) de mi raw y procesado de datos. (4) 'rpt' Donde almacenar los informes que me han distribuido.

TODOS mis archivos se nombran usando muy detallado con nombres como 'analysis_of_network_abc_for_research_on_modified_buffer_19may2011'

También escribo documentación detallada hasta el frente, donde organizo la hipótesis, hipótesis, criterios de inclusión y exclusión, y los pasos que tengo la intención de tomar para llegar a mi entrega. Todo esto es de un valor incalculable para repetible de investigación y hace que mi meta anual de ajuste de proceso más fácil.

HTH, Se

2voto

Raptrex Puntos 115

Ahora que he hecho el cambio a Sweave yo nunca quiero volver. Especialmente si usted tiene un terreno como de salida, es mucho más fácil seguir la pista de código usado para crear cada parcela. También hace que sea mucho más fácil corregir una cosa menor al principio y al tenerlo rizado a través de la salida sin tener que volver a ejecutar nada de forma manual.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X