113 votos

¿Qué habilidades se requieren para realizar análisis estadísticos a gran escala?

Muchos trabajos estadísticos piden experiencia con datos a gran escala. ¿Cuáles son los tipos de habilidades estadísticas y computacionales que se necesitarían para trabajar con grandes conjuntos de datos? Por ejemplo, ¿qué hay de la creación de modelos de regresión dado un conjunto de datos con 10 millones de muestras?

12voto

Carl Russmann Puntos 1560

Las buenas habilidades de programación son una necesidad. Necesita ser capaz de escribir código eficiente que pueda lidiar con grandes cantidades de datos sin atragantarse, y tal vez ser capaz de paralelizar dicho código para que se ejecute en una cantidad razonable de tiempo.

5voto

highBandWidth Puntos 977
<ol> <li>Enmarcar el problema en el marco <a href="http://en.wikipedia.org/wiki/MapReduce" rel="nofollow">de reducción de mapas.</a></li> <li>El lado de la <em>ingeniería</em> del problema, por ejemplo,, ¿cuánto duele usar una precisión más baja para los parámetros, o la selección de modelos basada no solo en la generalización, sino también en los costos de almacenamiento y computación?</li> </ol>

5voto

Steve Scheffler Puntos 1166

También añadiría que los datos a gran escala también introducen el problema de los posibles "datos incorrectos". No solo faltan datos, sino errores de datos y definiciones inconsistentes introducidas por cada pieza de un sistema que alguna vez tocó los datos. Por lo tanto, además de las habilidades estadísticas, debe convertirse en un limpiador de datos experto, a menos que alguien más lo esté haciendo por usted.

-Ralph Winters

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X