Contexto: En respuesta a una pregunta anterior sobre la investigación reproducible Jake escribió
Un problema que descubrimos cuando crear nuestro archivo JASA fue que las versiones y los valores predeterminados de los paquetes de CRAN cambiaban. Así que, en ese archivo, también incluimos las versiones de los paquetes que utilizamos. El sistema basado en viñetas probablemente se romperá cuando la gente cambie sus paquetes (no estoy seguro de cómo incluir paquetes adicionales dentro del paquete que es el Compendio).
Finalmente, me pregunto qué hacer cuando R mismo cambia. ¿Hay formas de de producir, digamos, una máquina virtual que reproduzca todo el entorno computacional utilizado para un papel de manera que la máquina virtual no sea no sea enorme?
Pregunta:
- ¿Cuáles son las buenas estrategias para garantizar que los análisis de datos reproducibles sean reproducibles en el futuro (digamos, cinco, diez o veinte años después de la publicación)?
- En concreto, ¿cuáles son las buenas estrategias para maximizar la reproducibilidad en curso cuando se utiliza Sweave y R?
Esto parece estar relacionado con la cuestión de garantizar que un proyecto de análisis de datos reproducible se ejecutará en la máquina de otra persona con valores predeterminados, paquetes, etc. ligeramente diferentes.