8 votos

Preservar comentarios sobre gráficos para el análisis exploratorio de datos

En la realización de análisis exploratorio de datos, voy a menudo imprimir los gráficos y escribir comentarios y anotaciones, etc.

¿La gente tiene sugerencias para una mejor electrónica de metodología? Estoy especialmente interesado en python/R.

Estoy buscando algo rápido (y sucio)' que no ralentiza el trabajo exploratorio, pero ayuda a que el registro de ideas que he hecho.

Lo que me imagino es la generación de gráficos como archivos Pdf y, a continuación, añadir comentarios.

Idealmente me gustaría la opción de hacerlo mediante programación, así que si me rehacer los gráficos me puede 'automáticamente' agregar los comentarios de nuevo.

5voto

Nick Cox Puntos 22819

Hay una solución fácil que muchas personas han encontrado útiles. Si usted encuentra que es trivial, no voy a estar en desacuerdo. Esta corta a través de la estadística de software, sistema operativo y otro de computación detalles.

Sólo tienes que copiar y pegar los gráficos en tu palabra favorita o procesador de texto y, a continuación, añadir sus propios comentarios. Que podría significar MS Word, software de apoyo TeX, LaTeX, etc.

Eso es todo. Claramente las ventajas son la sencillez (nada nuevo para aprender) y la flexibilidad (agregar lo que usted quiere de la manera que usted lo desea).

Esto no es una solución automatizada. Pero incluso las soluciones de automatización dependen de la fed de la información en los gráficos y sus comentarios, así que lo que es diferente?

3voto

throwaway Puntos 18

Recomiendo Jupyter Portátil, que le permite crear documentos que contienen intercalados bloques de código, diagramas y notas/documentación. El documento puede incluir las rebajas y el látex, que es automáticamente prestados (tanto como escribir en CrossValidated). Cuando se ejecuta un bloque de código, cualquier salida de texto y de los gráficos que se genera se agregan en línea para el documento. Usted puede cambiar un bloque de código y vuelva a ejecutar la actualización de la salida/parcelas. Esto es bueno para probar las cosas de forma interactiva (por ejemplo, ajustar el/los código / parámetros para ver qué pasa). Creo que es más fácil que tener que las cifras de exportación y pegarlos en una tradicional, documento estático, especialmente si usted cambia nada. Puede exportar un cuaderno de PDF, etc. para obtener una copia estática.

Es de código abierto y funciona con Python, R, y otros idiomas. La interfaz está basada en el navegador, por lo que es multiplataforma y fácil de compartir blocs de notas. Puede ejecutar el backend en su propia máquina, o puede alojar portátiles en un sitio web para que otros puedan editar/ver/ejecutar desde cualquier lugar (el código se ejecutará en el servidor). Al parecer hay una manera de configurar el bloc de notas como el frontend para un clúster de cálculo para los cálculos paralelos.

2voto

Nixit Patel Puntos 34

Yo tiendo a hacer más y más análisis en R notebooks dentro de RStudio. De esta manera, puedo tener el código, anotaciones y gráficos juntos en un solo lugar y no tiene que generar archivos pdf de todo el tiempo - que es un verdadero ahorro de tiempo. Escribe el texto y el código en un editor de texto y haciendo clic en un botón, el código se ejecuta (y el gráfico dibujado) en su lugar. Así que el texto, código y parcela de permanecer perfectamente juntos. También es muy fácil de convertir en HTML o PDF por algunos clics del ratón. No sé, cómo bien esto funciona con Python, ya que en su mayoría utilizan R.

1voto

hplieninger Puntos 460

En R : A veces agrego una trama extra a un pdf con alguna información básica. Esto es muy útil si las anotaciones son cortas y se relacionan con los datos de la trama de tal manera que se puede paste información adicional. Por ejemplo:

 pdf("cars-plots.pdf")
plot(cars)
plot.new()
legend("center", bty = "n", legend =
           paste0("Data: 'cars'\n",
                  "cor = ", round(cor(cars)[1, 2], 2), "\n",
                  "N = ", nrow(cars), "\n",
                  Sys.Date()))
dev.off()
 

Alternativamente, si tiene anotaciones más largas, producir un informe utilizando R Markdown podría ser una solución.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X