Como un entusiasta usuario de R, bash, Python, asciidoc, (La)TeX, de código abierto sofwtare o cualquier país de la onu*x herramientas, no puedo ofrecer una respuesta objetiva. Además, como a menudo argumentan en contra de la utilización de MS Excel o una hoja de cálculo de cualquier tipo (bueno, ver sus datos, o parte de ella, pero ¿qué otra cosa?), No me gustaría contribuir positivamente al debate. Yo no soy el único, por ejemplo,
-
Hoja de cálculo de la Adicción, desde el P. Quemaduras.
-
MS Excel precisión y exactitud, de un post en el 2004 R de la lista de correo
- L. Knusel, Sobre la exactitud de las estadísticas de distribución en Microsoft Excel 97, Estadística Computacional Y Análisis de Datos, 26: 375-377, 1998. (pdf)
- B. D. McCullough & B. Wilson, En la precisión de los procedimientos estadísticos en Microsoft Excel
2000 y Excel XP, Estadística Computacional Y Análisis de Datos, 40: 713-721, 2002.
- M. Altman, J. Gill & M. P. McDonald, Numérico de Problemas de Computación Estadística para las ciencias Sociales, Wiley, 2004. [por ejemplo, páginas 12-14]
Un colega mío suelta a todos sus macros debido a la falta de compatibilidad con versiones anteriores, etc. Otro colega intentó importar la genética de datos (alrededor de 700 sujetos con genotipo en 800,000 marcadores, 120 Mo), sólo a mirar "a por ellos". Excel error, el Bloc de notas le dio demasiado... soy capaz de "mirar a ellos" con vi, y cambiar rápidamente el formato de los datos con algunos sed/awk o perl script. Así que creo que hay diferentes niveles a considerar cuando se habla acerca de la utilidad de las hojas de cálculo. Ya sea que usted trabaje en pequeños conjuntos de datos, y sólo desea aplicar estadísticas elementales a las cosas, y tal vez está bien. A continuación, le toca a usted para confiar en los resultados, o siempre puedes pedir el código fuente, pero tal vez sería más sencillo para hacer una prueba rápida de todos los en línea de los procedimientos con el NIST de referencia. No creo que corresponde a una buena manera de hacer estadísticas, simplemente porque este no es un verdadero software estadístico (en mi humilde opinión), aunque como una actualización de la lista antes citada, las nuevas versiones de MS Excel parece haber demostrado mejoras en la exactitud de los análisis estadísticos, ver Keeling y Pavur, Un estudio comparativo de la fiabilidad de los nueve paquetes de software de estadística (CSDA 2007 51: 3811).
Aún así, sobre un papel de 10 o 20 (en biomedicina, psicología, psiquiatría) incluye gráficos realizados con Excel, a veces sin quitar el fondo gris, la horizontal de la línea de color negro o el automático de la leyenda (Andrew Gelman y Hadley Wickham son sin duda tan feliz como cuando me visto). Pero más en general, tienden a ser los más utilizados "software" de acuerdo a una reciente encuesta en FlowingData, que me recuerdan a un viejo hablar de Brian Ripley (que co-autor de la MASA paquete de R, y escribir un libro excelente sobre el reconocimiento de patrones, entre otros):
No nos engañemos: la mayoría de los
ampliamente utilizado pieza de software para
estadísticas de Excel (B. Ripley a través de Ene
De Leeuw), http://bit.ly/dB5K6r
Ahora, si usted siente que proporciona una rápida y fácil manera de obtener tus estadísticas hecho, ¿por qué no? El problema es que todavía hay cosas que no se pueden hacer (o al menos, es bastante difícil) en dicho entorno. Creo que de bootstrap, permutación, multivariante de análisis exploratorio de datos, para nombrar unos pocos. A menos que usted es muy competente en VBA (que no es ni scripts ni un lenguaje de programación), me inclino a pensar que incluso la menor de las operaciones sobre los datos que se manejan mejor en virtud de R (o Matlab, o Python, proporcionando obtener la herramienta adecuada para tratar con, por ejemplo, los llamados datos.marco). Por encima de todo, creo que Excel no muy promover buenas prácticas para el analista de datos (pero también se aplica a cualquier "cliquodrome", véase la discusión en Medstats acerca de la necesidad de mantener un registro de procesamiento de datos, documentación de análisis de datos y ediciones), y he encontrado este post en Práctica Estadísticas relativamente ilustrativos de algunos de Excel trampas. Aún así, se aplica a Excel, no sé cómo se traduce en GDocs.
Acerca de compartir su trabajo, tiendo a pensar que el Github (o Esencia de código fuente) o Dropbox (aunque EULA podría disuadir a algunas personas) son muy buenas opciones (revisión de la historia, la gestión de la subvención si es necesario, etc.). No puedo fomentar el uso de un software que básicamente almacenar los datos en un formato binario. Sé que puede ser importado en R, Matlab, Stata, SPSS, pero a mi opinión:
- los datos deben definitivamente ser en un formato de texto que puede ser leído por otro software estadístico;
- el análisis debe ser reproducible, lo que significa que debe proporcionar un script completo para su análisis y se debe ejecutar (nos acercamos al caso ideal cerca de aquí...) en otro sistema operativo en cualquier momento;
- su propio software estadístico debe implementar reconoció algoritmos y debe haber una manera fácil de actualizar para reflejar las mejores prácticas actuales en la modelización estadística;
- el sistema de intercambio que usted elija debe incluir el control de versiones y de colaboración de las instalaciones.
Eso es todo.