4 votos

¿Qué prueba estadística puedo utilizar para detectar la aglomeración?

Tengo datos de series temporales que representan las fechas/horas de las operaciones realizadas en un mercado financiero.

Me gustaría asignar una puntuación a estos datos que represente si las operaciones son mostly clustered en torno a determinados valores temporales o si son mostly spread out uniformemente. Voy a tener unos 1000+ resultados por conjunto de datos.

Ejemplo de situación uno (Alto grado de "clustering" ):

1. 01/01/01 : 13:00 
2. 01/01/01 : 13:10
3. 01/01/01 : 13:15
4. 01/01/01 : 13:25
5. 03/05/01 : 17:20
6. 03/05/01 : 17:35
7. 03/05/01 : 17:40
8. 03/05/01 : 17:45

Ejemplo de situación dos( Bajo grado de "clustering")"

1. 01/01/01 : 13:00
2. 01/05/01 : 02:30
4. 02/12/01 : 06:40
5. 02/25/01 : 02:30
6. 03/30/01 : 21:10
7. 04/12/01 : 02:20
8. 05/02/01 : 03:25

Por supuesto, puedo convertir todas las marcas de tiempo a tiempo posix o lo que sea, así que hacer cálculos con los valores de tiempo no será un problema.

Estaba pensando en un posible error estándar.

(Para los que quieran más información de fondo: Estoy utilizando los resultados del backtest para modular el tamaño de mi posición de entrada de una manera compleja. Si los resultados contienen operaciones agrupadas, entonces no cuentan realmente como 1 operación cada una (más bien como una gran operación). Esto significa que tales resultados no son fiables y no debo actuar sobre ellos). Gracias.

1voto

Alp Puntos 446

Yo simplemente calcularía una ventana móvil del número de operaciones (o del volumen en dólares) por hora, día, semana o cualquier marco temporal que tenga sentido. Por ejemplo, podría utilizar 1 día como ventana móvil. Si 1 operación al día es un grado bajo de agrupación, 10 operaciones al día podrían ser un grado alto de agrupación. Si es así, entonces una escala lineal "y" para un "gráfico de agrupación" es probablemente razonable.

He aquí un ejemplo:

Edición 2 ===========================================

A continuación, la versión actualizada de la trama. Al igual que los gráficos anteriores, la línea gris es de una "ventana" de 1 día donde el "número de grupo" es el número de operaciones del día anterior. La nueva línea azul es de una "ventana" de 5 días donde el "número de cluster" es la suma de las operaciones de los 5 días anteriores dividida por 5 (la división por 5 es para escalar el resultado para que pueda ser comparado directamente con una "ventana" de 1 día). La nueva línea púrpura procede de una "ventana" que suma las operaciones de 10 días y luego se divide por 10, y la nueva línea verde procede de una "ventana" de 20 días, dividida por 20.

El último día del gráfico (extremo derecho) corresponde al día 2010-07-02, donde los valores son:

Ventana de 1 día = 0

Ventana de 5 días = 2

Ventana de 10 días = 1,5

Ventana de 20 días = 1,25

Si hubiera elegido una "ventana" de 5 días, entonces antes de negociar el 2010-07-03 (suponiendo que sea el siguiente día de negociación), su "número de grupo" sería 2 (con una media de 2 operaciones diarias durante los 5 días anteriores).

Al igual que cualquier media móvil, cuanto más larga sea la "ventana", más suave será el gráfico. Sin embargo, este suavizado retrasa los picos y los valles. Compare el pico gris de principios de abril con el pico azul, luego el pico púrpura y después el pico verde. Puede que esto no sea un gran problema para el uso actual, pero pensé que era una buena idea señalarlo.

La conclusión es que tendrás que jugar con diferentes "ventanas" para llegar a la suavidad y puntualidad deseadas.

enter image description here

0voto

Tal vez utilizar una adaptación de J-Charts y/o Gráficos del perfil del mercado Pero en lugar de representar el precio (eje de ordenadas) frente al volumen (eje de abscisas), podría representar la hora de la operación (eje de ordenadas) frente al número de operaciones (eje de abscisas) y utilizar colores para delimitar los distintos días de negociación o las medias del número de operaciones en esos momentos para distintos períodos de referencia.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X