4 votos

Cómo medir la agrupación de propiedad de una secuencia

Para una secuencia de números en orden creciente, $a_1 < a_2, \dots < a_n$, quiero saber una medida para describir la extensión de la agrupación en clústeres en las secuencias.

Por ejemplo, una secuencia como $1, 2,3,4, 100, 101,102,103$ y otra secuencia $10, 12, 32, 45, 66,77, 89,102$, es claro para ver la primera secuencia tiene mayor agrupación de la propiedad.

1voto

dtldarek Puntos 23441

El comentario fue demasiado corto, por lo que estoy publicando esto como una respuesta.

Así, la agrupación es un hueso duro de roer, pero hay algunos aproximado maneras. Deje $b_n = a_{n+1}-a_{n}$, entonces cualquier función que mide la cercanía de $(b_n)$ a cero sería más o menos lo que usted está buscando. Tomar, por ejemplo, un histograma $(c_n)$ $(b_n)$ y calcular el $\sum_k \frac{c_k}{2^k}$ (es fácil crear diferentes pero similares fórmulas, usted debe elegir uno que se adapte a sus secuencias de los mejores).

Para otro ejemplo de la varianza: para dos secuencias ($b_n$s, las secuencias de las diferencias) con la misma media, varianza baja significaría constante, la constante de crecimiento (no clustering) y de varianza alta significaría necesariamente algunos de la agrupación. También, es posible que desee buscar en momentos de orden superior, por ejemplo, la curtosis, pero no tengo idea de si esto va a ser relevante para las secuencias que usted considere.

Finalmente, se puede calcular la probabilidad de la secuencia en una cierta probabilidad de espacio. Por ejemplo, usted podría suponer que algunos de distribución con valor medio es la media de la secuencia con la condensación de todo lo que refleja su idea de clusters.

Sé que lo que yo escribí es muy vaga, pero espero que te dará algunas ideas. Saludos!

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X