12 votos

¿Por qué utilizar variables de sesión?

Probablemente, esta es una pregunta muy básica, pero me parece que no ser capaz de encontrar una respuesta sólida. Espero que aquí, puedo.

Actualmente estoy leyendo los papeles como una preparación para mi tesis de maestría. Actualmente, estoy leyendo un papel que investiga la relación entre tweets y mercado de valores características.

En uno de sus hipótesis, que proponen que "el aumento en el tweet de volumen está asociado con un aumento en el volumen de negociación".

Yo esperaría de ellos, en los pares de correlaciones, para correlacionar tweetVolume con tradingVolume, pero en lugar de que se informe mediante el registro de versiones: LN(tweetVolume) y LN(tradingVolume).

Para mi tesis, me han replicado este poco de su papel. He recogido los tweets acerca de las 100 empresas de más de 6 meses (tweetVolume) y la bolsa de comercio de volumen para el mismo período de tiempo. Si me correlacionar la absoluta variables, me parece r=.282, p.000 pero cuando uso el registro de versiones, me parece r=.488, p=.000.

No entiendo por qué los investigadores a veces uso registran versiones de sus variables y por qué la correlación parece mucho más si lo hace. ¿Cuál es el razonamiento aquí, y por qué es ACEPTAR a utilizar registra las variables?

Su ayuda es muy apreciada :-)

24voto

Zizzencs Puntos 1358

Razones para usar registra las variables se dividen en dos categorías: Estadística y de fondo.

Estadísticamente, si las variables son derecho-skew (es decir, tienen una larga cola en el extremo superior), a continuación, una medida como la correlación o regresión puede ser influenciado mucho por uno o pocos casos en que los de gama alta en una o ambas variables (valores atípicos, puntos de apalancamiento, influyente puntos). Tomando el registro puede ayudar esta al reducir o eliminar el sesgo.

En cuanto al fondo, algunos conceptos son mejor pensar en términos de cocientes de diferencias. Tomar las dos medidas de volumen de discutir. Ahora, comparar dos empresas: Una de una pequeña empresa de comercio en el NASDAQ que pocas personas han oído hablar de la otra una mega-corporación. El primero será obtener muy pocos tweets por día. Esto último se consigue a muchos; de manera similar para el volumen de transacciones. Supongamos que (escoger sólo números) que la empresa a recibe normalmente 100 tweets por día y el último obtiene de 100.000.

Si la compañía a los tweets de ir de 100 a 500 (una diferencia de 400, una proporción de 5) que la gran noticia - algo debe estar pasando. Pero si la empresa B van desde los 100.000 a los 100,400 (una diferencia de 400, que es un índice muy cercano a 1) a nadie le importa. El equivalente aproximado sería si se pasó de 100.000 a 500.000 dólares.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X