Muchas personas utilizan una principal herramienta como Excel u otra hoja de cálculo, SPSS, Stata o R sus estadísticas necesidades. Ellos pueden recurrir a algunos de paquete específico para necesidades muy especiales, pero un montón de cosas que se pueden hacer con una simple hoja de cálculo o un general de estadísticas paquete o estadísticas entorno de programación.
Siempre me ha gustado Python como lenguaje de programación, y por simples necesidades, es fácil escribir un pequeño programa que calcula lo que necesito. Matplotlib me permite parcela.
Alguien ha cambié completamente de, digamos R, Python? R (o cualquier otro paquete de estadísticas) tiene un montón de funcionalidades específicas para las estadísticas, y tiene estructuras de datos que permiten pensar acerca de las estadísticas que desea realizar y menos acerca de la representación interna de los datos. Python (o algún otro lenguaje dinámico) tiene la ventaja de permitir que me programa en un familiar, un lenguaje de alto nivel, y me permite mediante programación interactuar con los sistemas del mundo real en el que residen los datos o de la que puedo tomar las mediciones. Pero todavía no he encontrado ningún paquete de Python que me permita expresar las cosas con la "estadística de la terminología" – desde la simple estadística descriptiva para más complicados métodos multivariantes.
¿Qué se puede recomendar si quería usar Python como un "herramienta estadística" para reemplazar al R, SPSS, etc.?
¿Qué iba a ganar y perder, basado en su experiencia?