Para mi tesis, he recogido el volumen de búsqueda de datos (svi
) de Google y los datos de los mensajes de Twitter (tweets
es el número de tweets diarios) para varias empresas (comp
). La variable tradevol
es el volumen de negociación en la bolsa de valores de una empresa, tomado de Yahoo! Las finanzas. svi
y tweets
son mis variables independientes, tradevol
es dependiente.
Para el motivo de la discusión, decir que me han recopilado datos de más de 3 días para cada una de las 3 empresas (en realidad, tengo los datos para 100 empresas se reunieron durante 200 días), de la siguiente manera:
comp date svi tweets tradevol
-------------------------------------
1 02-12 1.07 223 2,209,425
1 02-13 1.03 200 2,021,502
1 02-14 1.10 196 2,124,555
2 02-12 0.55 110 1,942,211
2 02-13 0.45 211 1,532,453
2 02-14 0.41 104 1,432,655
3 02-12 1.05 303 1,765,273
3 02-13 1.08 250 1,932,672
3 02-14 1.09 277 1,597,892
Un conjunto de datos como este, con mediciones a lo largo del tiempo va más allá de lo que ha sido difícil durante mis estudios. Así que tengo que entender cómo analizar este. Por lo tanto, tengo algunas preguntas, el análisis de este conjunto de datos en el programa SPSS / PASW.
- ¿Cómo puedo, a partir de este conjunto de datos, medir la correlación entre
svi
ytradevol
para cada empresa? Me gustaría que de algún modo se tiene que decirle a SPSS para dividir el archivo de datos encomp
, el cálculo de la correlación para cada una de las únicascomp
- Mi tesis-el entrenador llama a este conjunto de datos de un "conjunto de datos de panel". Sin embargo, la búsqueda para "paneldata análisis SPSS" yo no encontrar mucha información útil. Si quiero realizar una regresión, la medición de los efectos de
svi
ytweets
atradevol
, ¿cómo se llama entonces? Una de regresión multinivel? - Con respecto a la regresión, mi entrenador me quiere para dar cuenta de una timelag. Por ejemplo, hoy en día
svi
ytweets
puede no tener un efecto en la actualtradevol
pero tal vez hay un efecto (o: un mayor efecto) de hoy en díasvi
ytweets
en tomorrowstradevol
. En este caso, yo tendría que llevar a cabo la regresión para los gal t-2, t-1, t, t+1 y t+2. Esta operación posible llevar a cabo con el programa SPSS (18) y si es así, por favor enviarme algo para ir :-)
Cualquier ayuda es muy apreciada :-)