Usted puede aprender mucho por explorar las relaciones temporales entre los datos antes de salir a métodos más sofisticados de análisis de series de tiempo.
Debido a que la imagen no proporciona una escala horizontal, yo he usado uno artificial (coordenadas de píxel de la imagen de las columnas). He libremente ajustaron las dos parcelas y se coloca a la actividad en cero, que es probable que lo mínimo es:
(Hay un pequeño problema en los dos gráficos que originalmente se superponen, pero que no afectan el análisis).
Porque estás buscando un potencial efecto causal de la actividad (rojo) en volumen (azul), parcela adelante la función de correlación cruzada. Esto simplemente se calcula la correlación de la actividad[1..n+1-k] y el volumen[k..n] como una función de k (el "lag"). Mi primer paso en este, como sería de esperar-que la extrema pico de actividad tiene una gran capacidad de influencia, así que me fui de nuevo y se utiliza el logaritmo de 1+actividad en su lugar. Aquí está la correlación cruzada:
Alcanza un pico definido en un intervalo de k=20. (El pico de uso de las no transformadas actividades se en k=18, es esencialmente el mismo.) Para ver mejor lo que está pasando, mire el diagrama de dispersión de la actividad[1..n+1-20] en contra de volumen[20..n]:
Es decir, cada registro de la actividad valor de (x) se traza contra el volumen después de 20 unidades de tiempo transcurrido (y). (Los puntos son de color según la hora. Esto es realmente un gráfico 3D con el tiempo como la coordenada z, miró de arriba. 3D manipulaciones hacer los patrones más claro.)
Este diagrama de dispersión hace evidente que la relativamente alta correlación en este lag (alrededor de 0.40 de acuerdo a la anterior parcela) se debe enteramente a el pico de la actividad en el momento de 220 ser seguido por el volumen de pico en el momento de 220+20 (seguido por una caída de poco a partir de entonces). Todo lo demás se parece al azar errante. Esto nos dice que no puede ser menos que salta a la vista: la aparición de una relación temporal entre estas dos series es causada por un solo evento y sus consecuencias; no parece ser una asociación general.
En efecto, puede que tenga una observación de una alta actividad, seguido después de un cierto tiempo corto por un aumento en el volumen. Era esto una coincidencia o (esperemos) la evidencia de un patrón? Es imposible decir. Datos adicionales pudiera llevar a cabo esta generalización o puede falsificar. Independientemente, de la cruz-gráficos de correlación y rezagados diagramas de dispersión son de gran alcance y herramientas útiles para evaluar las relaciones.