14 votos

Correlación de volumen de series de tiempo

Considere el siguiente gráfico:

twitter and trading volume

La línea roja (eje izquierdo) describe el volumen de operaciones de un determinado stock. La línea azul (eje derecho) describe el mensaje de twitter de volumen para que la stock. Por ejemplo, el 9 de Mayo (05-09) acerca de 1.100 millones de oficios y 4.000 tweets fueron hechas.

Me gustaría saber si existe una correlación entre la unicc, ya sea en el mismo día o con un desfase de - por ejemplo: tweet volumen se correlaciona con el volumen de comercio un día más tarde. Estoy leyendo muchos artículos que han realizado este tipo de análisis, por ejemplo, la Correlación Financiera de Series de Tiempo con Micro-Blogging Actividad, pero que no describen cómo se hace un análisis en términos prácticos. El siguiente se indica en el artículo:

enter image description here

Sin embargo, tengo muy poca experiencia con el análisis estadístico y no sabe cómo ejecutar esto en la serie a la que tengo. Yo uso el programa SPSS (también conocido como PASW) y mi pregunta es: ¿cuáles son los pasos a seguir para hacer un análisis desde el punto donde tengo un fichero de datos subyacente de la imagen de arriba? Es una prueba de una característica por defecto (y cómo se llama) y/o ¿cómo podría yo más ejecutarlo?

Cualquier ayuda sería muy apreciada :-)

11voto

Owen Fraser-Green Puntos 642

El coeficiente de correlación entre las series de tiempo es inútil ver http://empslocal.ex.ac.uk/people/staff/dbs202/cat/stats/corr.html . Esto fue señalado por U. Yule en 1926 Yule, G. U, 1926, "¿por Qué a veces podemos obtener una tontería correlaciones entre las series de tiempo? Un estudio en el muestreo y la naturaleza de las series de tiempo", Revista de la Sociedad Real de Estadística 89, de 1 a 64. . Usted podría querer a google "¿por qué nos da una tontería correlatio" para más. La razón de esto es pruebas de correlación pagais conjunta de la normalidad. Articulación de la normalidad requiere cada una de las series a ser normal. La normalidad requiere de la independencia . Para examinar la relación entre el tiempo de la serie, por favor revise la Función de Transferencia de la Identificación en cualquier buen libro de la serie de tiempo como http://search.barnesandnoble.com/Time-Series-Analysis/William-WS-Wei/e/9780201159110

RETO RESPUESTA

En términos de una respuesta a su desafío. Es bien sabido , por un par de http://web.ku.edu/~finpko/myssi/FIN938/Yule.Espurias%20Regression.JRSS_1926.pdf que la correlación de dos series de tiempo puede ser errónea sobre todo si cualquiera de las series se ven afectados por los pulsos de nivel/turnos/temporada de pulsos y/o de las tendencias en el tiempo. Siendo ese el caso, me gustaría tomar cada una de las series por SEPARADO e identificar la estructura ARIMA y cualquier pulsos/nivel de turnos/temporada de pulsos y/o la hora local de las tendencias que se puedan aplicar y crear un error de proceso. Con dos limpias error procesos , uno para cada uno de los dos originales de la serie , me gustaría calcular la correlación cruzada, que podría ser utilizado para medir el grado de asociación por encima y más allá de la auto-correlación de la estructura dentro de cada serie. Esta solución se llama la doble pre-enfoque para blanquear . Ver http://www.jstor.org/discover/10.2307/1391593?uid=3739864&uid=2&uid=4&uid=3739256&sid=47698947414057 o http://www.fil.ion.ucl.ac.uk/spm/doc/books/hbf2/pdfs/Ch10.pdf o http://search.barnesandnoble.com/Time-Series-Analysis/William-WS-Wei/e/9780201159110

6voto

Taylor Puntos 692

Dos de verificación para bivariante normalidad comprobar tres cosas:

  1. compruebe si la primera serie de observaciones que es un poco normal,
  2. compruebe si la segunda serie de observaciones que es un poco normal,
  3. en detrimento de la otra y comprobar si los residuos son normales.

Para comprobar la normalidad en cada uno de estos pasos, el uso normal q-q parcelas o puede utilizar cualquiera de normalidad de la prueba de hipótesis.

O, alternativamente, usted puede comprobar si cada posible combinación lineal (coeficientes reales) de las dos series es un poco normal. Que probablemente iba a chupar sin embargo.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X