Tengo datos de series temporales que representan las fechas/horas de las operaciones realizadas en un mercado financiero.
Me gustaría asignar una puntuación a estos datos que represente si las operaciones son mostly clustered
en torno a determinados valores temporales o si son mostly spread out
uniformemente. Voy a tener unos 1000+ resultados por conjunto de datos.
Ejemplo de situación uno (Alto grado de "clustering" ):
1. 01/01/01 : 13:00
2. 01/01/01 : 13:10
3. 01/01/01 : 13:15
4. 01/01/01 : 13:25
5. 03/05/01 : 17:20
6. 03/05/01 : 17:35
7. 03/05/01 : 17:40
8. 03/05/01 : 17:45
Ejemplo de situación dos( Bajo grado de "clustering")"
1. 01/01/01 : 13:00
2. 01/05/01 : 02:30
4. 02/12/01 : 06:40
5. 02/25/01 : 02:30
6. 03/30/01 : 21:10
7. 04/12/01 : 02:20
8. 05/02/01 : 03:25
Por supuesto, puedo convertir todas las marcas de tiempo a tiempo posix o lo que sea, así que hacer cálculos con los valores de tiempo no será un problema.
Estaba pensando en un posible error estándar.
(Para los que quieran más información de fondo: Estoy utilizando los resultados del backtest para modular el tamaño de mi posición de entrada de una manera compleja. Si los resultados contienen operaciones agrupadas, entonces no cuentan realmente como 1 operación cada una (más bien como una gran operación). Esto significa que tales resultados no son fiables y no debo actuar sobre ellos). Gracias.