13 votos

¿Cómo ver grandes datos de series temporales de forma interactiva?

A menudo trato con una cantidad razonable de datos de series temporales, entre 50 y 200 millones de dobles con marcas de tiempo asociadas, y me gustaría visualizarlos dinámicamente.

¿Existe algún programa informático que lo haga eficazmente? ¿Qué hay de las bibliotecas y los formatos de datos? Zoom-caché es un ejemplo de biblioteca centrada en grandes series temporales. En Zoom-cache los datos se resumen en varias resoluciones para facilitar su visualización en diferentes resoluciones.

Editar: También si hay algún otro lugar donde debería hacer esta pregunta o buscar una respuesta por favor hágamelo saber.

1 votos

Aunque no tengo ni idea de cómo escalará con un número tan grande de puntos de datos, puede que quieras echar un vistazo a Cubism.js .

0 votos

Eché un vistazo a Cubism, que parece bueno para los gráficos de actualización incremental de los flujos de datos en serie, pero con mi corta búsqueda no vi nada sobre el almacenamiento en caché de múltiples resoluciones o datos de resumen para acelerar grandes conjuntos de datos. Eso es por el puntero aunque parece una biblioteca fresca.

1 votos

Quizá le interese Zoomdata zoomdata.com/product/fast-data-sharpening-visualization Sin embargo, sus precios son bastante elevados.

3voto

Oly Puntos 51

Lo siento por el auto-anuncio, pero Thunderplot (thunderplot.com) sería un buen candidato para ello. Lo escribí exactamente para el trazado interactivo de grandes conjuntos de datos. No lo he probado con conjuntos de datos de 200KK filas, pero funciona bien con ~10KK filas. También hay "leer cada fila Nth" característica, por lo que puede reducir la cantidad de datos para almacenar / visualizar. Puedo enviarte la clave de registro a cambio de uno de esos grandes conjuntos de datos. :-)

thunderplot screenshot

2voto

Joe Frazier Puntos 101

Existe un conjunto de herramientas de investigación denominadas TimeSearcher 1--3 que proporcionan algunos ejemplos de cómo tratar con grandes conjuntos de datos de series temporales. A continuación se muestran algunas imágenes de ejemplo de TimeSearcher 2 y 3.

TimeSearcher 2

TimeSearcher 3

1voto

Sacha Puntos 11

Otro post de autopromoción porque trabajo para esta empresa, pero SensorCloud (sensorcloud.com) utiliza algoritmos inteligentes para graficar conjuntos de datos masivos muy rápidamente. Fue diseñado originalmente con nuestros sensores físicos en mente, pero tiene un cargador CSV para manejar cualquier dato de series de tiempo.

Por ejemplo, subimos un conjunto de datos que tenía 100.000 millones de puntos de datos (más de 1 terabyte de valores de marca de tiempo + datos) y se puede hacer un gráfico e interactuar con él muy rápidamente.

Aquí hay un enlace público a ese conjunto de datos: https://sensorcloud.microstrain.com/SensorCloud/data/Z3MFURATHIB8A032/

El enlace anterior utiliza nuestro visor de flash. Si no quieres usar flash, aquí tienes el visor de javascript: https://sensorcloud.microstrain.com/SensorCloud/data/Z3MFURATHIB8A032/js/

Utiliza la rueda de desplazamiento o Shift+clic izquierdo para ampliar la imagen.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X