Un amigo mío ha sugerido que la industria del software, principalmente
las necesidades de "big data" habilidades, no de las estadísticas de las habilidades de por sí.
Mientras parcialmente de acuerdo con tu amigo del comentario, me gustaría señalar que, en cualquier industria, las Grandes herramientas de datos se optó, sólo si todas la V están satisfechos.
Yo trabajo como jefe de ciencia de datos en un cliente líder en el apoyo de la empresa. Aquí, yo hago los datos de la piratería, tanto para el producto y también para el crecimiento de la empresa.
Yo principalmente uso de técnicas de análisis de series de tiempo para el churn de predicción y análisis de ventas. Esto también incluye el análisis del comportamiento de los clientes, la competencia y la industria.
En el lado de los productos, utilizamos una serie de técnicas a partir de análisis de sentimiento uso de LSTM, algoritmos de recomendación, etc.
Pero el enfoque principal se encuentra en análisis de series de tiempo. El flujo de trabajo general sería:
- La limpieza y las molduras de los datos.
- la exploratoria y explicativa de los análisis que implica la identificación de la estacionalidad, las tendencias y ciclos. Así, la necesidad de explorar las correlaciones, auto-correlaciones, y varios univariado y bivariado de las estadísticas; junto con la extensa trazado, incluyendo la dispersión, de la AFC, PAFC curvas.
- Ahora viene la previsión de parte, en donde los diversos modelos son probados cada uno de los otros, de tomar el paso 2 en seria consideración.
Herramientas utilizadas por mí: R, Python y Excel a veces.
E incluso la mezcla de ciencia de datos y el crecimiento de la piratería han probado a hacer magia en el dominio de la comercialización. Así, la demanda de los estadísticos y matemáticas nerds seguiría siendo como es; y no va a disminuir en cualquier lugar en el futuro cercano, especialmente cuando centrada en el cliente startups están floreciendo en todo el mundo.