30 votos

¿A quién seguir en github para conocer las mejores prácticas en análisis de datos?

Es útil estudiar el código de análisis de datos de los expertos. Recientemente he estado estudiando github y allí hay varias personas que comparten código de análisis de datos. Esto incluye algunos paquetes R (que, por supuesto, están disponibles directamente en CRAN), pero también varios ejemplos de investigación reproducible, en particular utilizando R ( ver esta lista R en github ).

  • ¿A quién hay que seguir en github para conocer las mejores prácticas en el análisis de datos?
  • Opcionalmente, ¿qué tipo de código comparten y por qué es útil?

19voto

Chris Bunch Puntos 639

Hadley Wickham . Tiene varios proyectos de análisis exploratorio de datos en Github que puedes consultar (por ejemplo, "data-baby-names"), y dada la maravilla de ggplot2/plyr/reshape, confío por defecto (aunque ciegamente) en sus buenas prácticas, especialmente con respecto a sus propios paquetes.

Además, te adelanta otros proyectos en los que está trabajando.

6 votos

(+1) También está trabajando en una serie de tutoriales sobre Desarrollo avanzado de R Muy práctico.

1 votos

@Jeromy De hecho, parece que esto no es más que una forma de redactar su futuro libro de texto (comprueba los tweets anteriores de HW).

10voto

DavLink Puntos 101

También sigo John Myles White GitHub repositorio . Hay varios proyectos orientados a los datos, pero también cosas interesantes para los desarrolladores de R:

  • ProjectTemplate un sistema de plantillas para la construcción de proyectos R;
  • log4r un sistema de registro.

8voto

maclema Puntos 5959

Diego Valle Jones . Su Github especialmente análisis de los homicidios en México es realmente interesante.

0voto

TopPot Puntos 218

Si trabaja con datos clínicos ( Por ejemplo , imagen médica , EMR o datos de monitorización fisiológica ), puede seguir Ramesh Sridharan ( @rameshvs ), Matteo Fumagalli ( @mfumagalli ), y José Ignacio Orlando ( @ignaciorlando ). En eso son geniales. Aunque puede que busques algo más amplio en términos de análisis de datos, el análisis de datos clínicos tiene grandes fundamentos para las mejores prácticas, ya que es un dominio crítico. Por lo tanto, puedes intentar profundizar en este campo. Además, puedes consultar bibliografía. Tienes alguna literatura interesante procedente de este campo [3, 4], sin embargo; si quieres echar un vistazo a análisis de datos médicos para cáncer de mama también puede seguir mi ( @FMCalisto ) [1, 2].

Referencias

[1] Calisto, F. M., Santiago, C., Nunes, N., & Nascimento, J. C. (2022). BreastScreening-AI: Evaluating medical intelligent agents for human-AI interactions. Artificial Intelligence in Medicine, 127, 102285.

[2] Calisto, F. M., Nunes, N., & Nascimento, J. C. (2020, septiembre). BreastScreening: sobre el uso de la multimodalidad en el diagnóstico por imagen médica. En Proceedings of the international conference on advanced visual interfaces (pp. 1-5).

[3] Knight, R., Vrbanac, A., Taylor, B. C., Aksenov, A., Callewaert, C., Debelius, J., ... & Dorrestein, P. C. (2018). Mejores prácticas para analizar microbiomas. Nature Reviews Microbiology, 16(7), 410-422.

[4] McGinnis, J. M., Olsen, L., Goolsby, W. A., & Grossmann, C. (Eds.). (2011). Los datos clínicos como elemento básico del aprendizaje sanitario: Creando y protegiendo un bien público: Resumen del taller. National Academies Press.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X