6 votos

Comparación de estrategias de investigación reproducible: brew o Sweave vs. R2HTML

Esta es una pregunta un poco más "reflexiva", pero considero que es importante plantearla.

Llevo unos días luchando por tener un flujo de trabajo más parecido al de la investigación reproducible. Estoy confundido con las dos estrategias diferentes para escribir un informe.

Las dos estrategias son:

  1. Barrer o elaborar cerveza. Donde hay un archivo report.Rnw o report.brew que tiene una mezcla de algún lenguaje de marcado (ya sea HTML o LaTeX) y código R entre llaves especiales (digamos <<>>= @). Este archivo debe ser ejecutado a través de Sweave o brew para crear el archivo de informe (report.html o report.tex).
  2. R2HTML (para HTML) y Hmisc (para LaTeX). Donde el archivo .r utiliza funciones de R para construir report.html o report.tex; la ejecución de los comandos de R genera el informe directamente.

Lo que está claro para mí es que la mayoría de la gente en línea parece estar utilizando la opción 1. Pero no entiendo por qué es tan común, cuando la opción 2 me parece (sin experimentar demasiado) que da menos trabajo.

¿Cuándo es mejor cada una de las dos estrategias?

0 votos

Basándome en tu comentario, sugeriría editar la pregunta para eliminar tus problemas con LaTeX, ya que eso hace que parezca una pregunta de HTML contra LaTeX, y mencionar la biblioteca Hmisc en el método 2 como una forma de hacer algo similar pero con LaTeX.

0 votos

Hola Aaron, voy a editarlo un poco...

2 votos

Gracias por la edición. Me he tomado la libertad de editarlo más a fondo para dejar más claro lo que hace Hmisc (y algunas otras ediciones menores); si pasa la revisión por pares, puedes decidir si sigue reflejando tu pregunta con precisión.

8voto

Raptrex Puntos 115

Nueva respuesta basada en el comentario de abajo:

Según tengo entendido, el método 1 consiste en mezclar código R y HTML o LaTeX en el mismo documento, utilizando Sweave o brew, por ejemplo, para crear un documento final, mientras que el método 2 consiste en utilizar código R para generar HTML o LaTeX, utilizando los paquetes R2HTML o Hmisc, por ejemplo, y luego sólo ejecutar el código R para crear el documento final. Yo sólo he utilizado el método 1, pero de todos modos voy a opinar.

En mi opinión, se trata de una cuestión de preferencia; no veo ninguna razón técnica o estadística para preferir una sobre la otra; ambas son formas de hacer que la investigación sea reproducible.

Creo que el método 1 es más fácil porque no tienes que saber cuáles son las funciones de R que crean el código LaTeX o HTML; sólo tienes que escribir el código R, y escribir el código HTML o LaTeX, y el software se encarga de unirlos. Esto es especialmente cierto cuando la salida de R es sólo una pequeña cantidad del documento final; sería un dolor escribir el código R necesario para dar salida a una gran cantidad de texto, por ejemplo. En los editores de texto inteligentes, también se obtiene el formato de sintaxis adecuado para cada tipo de código, lo que no se consigue cuando se utiliza R2HTML o Hmisc. Este método también separa los resultados del comentario de forma más limpia, en mi opinión.

Sin embargo, para fragmentos breves o simplemente para obtener los resultados de un comando sin comentarios, el uso de R2HTML o Hmisc podría ser más fácil, aunque (hablando desde mi experiencia), una vez que te acostumbras a Sweaving, nunca volverás atrás.

0 votos

Gracias por la respuesta Aaron. Sin embargo, fíjate que la pregunta no es entre HTML y LaTeX, sino entre escribir el informe y tener el código R en él, frente a escribir el código R que también incluye el código para construir el informe. Tal vez debería presentar un ejemplo para ilustrar - pero gracias por tomarse el tiempo para responder...

0 votos

Parece que tanto Aaron como yo tenemos la misma lectura de tu pregunta. Consideraría un ejemplo para ilustrar, y espero que podamos ser más útiles.

0 votos

@TalGalili: editado en base a tu comentario; además, considera poner esto en la pregunta, ver mi comentario a la pregunta para los detalles.

6voto

Eric Davis Puntos 1542

Estos son sólo algunos puntos.

  • Si sólo quieres escribir informes sencillos, el conjunto de comandos de LaTeX que necesitas aprender es mucho menor que si quieres hacer cosas complejas.
  • Un aspecto atractivo de LaTeX respecto a algunos sistemas de marcado sencillos es que si quieres características como la referenciación, la numeración automática, las tablas multipágina o un atractivo ajuste tipográfico, estas características están disponibles. En particular, ha habido características en las que inicialmente ni siquiera había pensado, pero cuando las he necesitado, han estado disponibles en LaTeX como un paquete.
  • Si quieres tu informe final en un formato diferente, como HTML o rtf, entonces puedes utilizar varios programas de conversión como pandoc para convertir el látex en ese formato.

0 votos

El punto 1 es tranquilizador :)

3voto

berberich Puntos 255

La otra cosa agradable potencialmente sobre LaTeX u otro marcado en el paradigma Sweave/odfWeave/asciiWeave es que para los informes repetidos se puede planificar un poco mejor una vez y luego simplemente reutilizar la plantilla. Véase el paquete rreport de Harrell como ejemplo

2voto

Brettski Puntos 5485

No hay problema en usar cualquiera de los dos, aunque confieso que no uso ninguno de los dos. Sospecho que la razón principal de la popularidad del método LaTeX/Sweave es el número de campos que utilizan LaTeX como su principal formato de papel/presentación/manuscrito que incentiva el uso de un sistema basado en LaTeX. No conozco ningún campo en el que un producto final .html sea tan directamente útil.

0 votos

No sé si la popularidad del látex se debe a los requisitos del campo. Yo trabajo en un campo (psicología) en el que casi en ningún sitio se usa tex, y todavía lo uso (para evitar dibujar tablas y formatear manualmente). Creo que su popularidad tiene más que ver con su antigüedad que con otra cosa.

0 votos

@richiemorrisroe Seguro que hay gente que lo usa por la razón que sea: les gusta, les disgusta el formato manual, lo que sea. Yo sin embargo me he encontrado, saltando entre campos, que me encuentro con campos que casi nunca utilizar LaTeX (el mío propio) y campos en los que una vez se afirmó "Si se va a publicar, debe estar en LaTex". Esa conversación acabó con una copia de las directrices de presentación de AJE.

1 votos

A veces me gustaría trabajar en uno de los campos más pesados de LaTeX, me ahorraría mucho tiempo y molestias a lo largo de mi doctorado.

1voto

Greg Puntos 7391

La razón por la que la opción 1 es tan común es porque... es muy común. Sweave existe desde hace más de 10 años y, para muchos usuarios de R, es sinónimo de investigación reproducible. Además, el tipo de personas que escuchan la frase "investigación reproducible" y piensan "eso suena muy bien" probablemente ya estén familiarizados con LaTeX. Por lo tanto, no es como si estuvieran eligiendo entre dos opciones porque muchos no sabrán que la opción 2 existe.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X