31 votos

Cómo aumentar la reproducibilidad a largo plazo de la investigación (especialmente utilizando R y Sweave)

Contexto: En respuesta a una pregunta anterior sobre la investigación reproducible Jake escribió

Un problema que descubrimos cuando crear nuestro archivo JASA fue que las versiones y los valores predeterminados de los paquetes de CRAN cambiaban. Así que, en ese archivo, también incluimos las versiones de los paquetes que utilizamos. El sistema basado en viñetas probablemente se romperá cuando la gente cambie sus paquetes (no estoy seguro de cómo incluir paquetes adicionales dentro del paquete que es el Compendio).

Finalmente, me pregunto qué hacer cuando R mismo cambia. ¿Hay formas de de producir, digamos, una máquina virtual que reproduzca todo el entorno computacional utilizado para un papel de manera que la máquina virtual no sea no sea enorme?

Pregunta:

  • ¿Cuáles son las buenas estrategias para garantizar que los análisis de datos reproducibles sean reproducibles en el futuro (digamos, cinco, diez o veinte años después de la publicación)?
  • En concreto, ¿cuáles son las buenas estrategias para maximizar la reproducibilidad en curso cuando se utiliza Sweave y R?

Esto parece estar relacionado con la cuestión de garantizar que un proyecto de análisis de datos reproducible se ejecutará en la máquina de otra persona con valores predeterminados, paquetes, etc. ligeramente diferentes.

2voto

vitule Puntos 132

Buenas sugerencias, ahora tengo muchas cosas que investigar.

Recuerde que una consideración extremadamente importante es asegurarse de que el trabajo es "correcto" en primer lugar. Este es el papel que desempeñan herramientas como Tejido jugar, aumentando las posibilidades de que lo que hiciste, y lo que dijiste que hiciste, sean la misma cosa.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X