28 votos

¿Por qué y cuándo crear un paquete R?

Entiendo que esta pregunta es bastante amplia, pero me pregunto cuáles deberían ser los puntos decisivos a la hora de decidir crear (o no) un nuevo paquete para R. Para ser más específico, añadiría que la pregunta no se refiere a las razones para usar R en sí mismo, más bien a la decisión de compilar varios scripts e integrarlos en un nuevo paquete.

Entre los puntos que podrían llevar a estas decisiones, he pensado (de forma bastante no exhaustiva), en :

  • la inexistencia de otros paquetes en el mismo subcampo ;
  • la necesidad de intercambiar con otros investigadores y permitir la reproducibilidad de los experimentos ;

Y entre los puntos que podrían llevar a una decisión contraria :

  • parte de los métodos utilizados ya presentes en algunos otros paquetes;
  • número de funciones nuevas no es suficiente para justificar la creación de un nuevo paquete independiente.

Puede que haya olvidado muchos puntos que podrían ir en cualquiera de las dos listas, y además, estos criterios parecen en parte subjetivos. Entonces, ¿qué diría usted que debería justificar, y en qué momento, el empezar a reunir diversas funciones y datos en un nuevo paquete documentado y ampliamente disponible?

5voto

JMW.APRN Puntos 21

Estoy de acuerdo con todo lo que he leído hasta ahora. Todas esas razones son buenas prácticas de programación y no se aplican a R en particular. Sin embargo, me encuentro escribiendo paquetes de R la mayor parte del tiempo, y por otra razón. Así que voy a añadir:

Razón específica de R para escribir un paquete de R:

  • porque se escribe en C

Siempre que se utilicen lenguajes extraños como C, C++ o FORTRAN (sobre todo para la informática de alto rendimiento), merece la pena escribir un paquete. Si tienes más de una o dos funciones, acabas rápidamente con archivos por todas partes y dependencias entre el código de R y el de C que son difíciles de mantener y de portar.

0voto

kjetil b halvorsen Puntos 7012

Una razón que no se menciona en las otras excelentes respuestas: Tienes un proyecto de análisis de datos grande o complejo. Empaquetar, primero, los datos como un paquete, y luego ampliarlo con funciones útiles para transformar, trazar o calcular análisis específicos. De esta manera, se obtiene una versión documentada de los datos completa con todas las funciones utilizadas para calcular el análisis reportado. A continuación, el informe o los informes del proyecto pueden escribirse utilizando knitr u otros paquetes para una investigación reproducible.

Esto podría ahorrar mucho tiempo si hay que hacer algún reanálisis, o incluso podría publicarse (o semipublicarse) si se publican los análisis.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X