Probablemente, esta es una pregunta muy básica, pero me parece que no ser capaz de encontrar una respuesta sólida. Espero que aquí, puedo.
Actualmente estoy leyendo los papeles como una preparación para mi tesis de maestría. Actualmente, estoy leyendo un papel que investiga la relación entre tweets y mercado de valores características.
En uno de sus hipótesis, que proponen que "el aumento en el tweet de volumen está asociado con un aumento en el volumen de negociación".
Yo esperaría de ellos, en los pares de correlaciones, para correlacionar tweetVolume
con tradingVolume
, pero en lugar de que se informe mediante el registro de versiones: LN(tweetVolume)
y LN(tradingVolume)
.
Para mi tesis, me han replicado este poco de su papel. He recogido los tweets acerca de las 100 empresas de más de 6 meses (tweetVolume
) y la bolsa de comercio de volumen para el mismo período de tiempo. Si me correlacionar la absoluta variables, me parece r=.282, p.000
pero cuando uso el registro de versiones, me parece r=.488, p=.000
.
No entiendo por qué los investigadores a veces uso registran versiones de sus variables y por qué la correlación parece mucho más si lo hace. ¿Cuál es el razonamiento aquí, y por qué es ACEPTAR a utilizar registra las variables?
Su ayuda es muy apreciada :-)