25 votos

Calcular aproximado de cuantiles para una secuencia de números enteros con momentos?

emigraron de matemáticas.stackexchange.

Estoy de procesamiento de una larga secuencia de números enteros y estoy considerando el seguimiento de un par de momentos en el fin de ser capaz de calcular aproximadamente diferentes percentiles de la corriente sin almacenar tantos datos. ¿Cuál es la forma más sencilla de calcular los percentiles de unos momentos. Hay un mejor enfoque que consiste en almacenar una pequeña cantidad de datos?

18voto

KP. Puntos 1177

No estado presente de forma explícita, pero por tu descripción del problema parece probable que usted está después de un alto sesgo conjunto de cuantiles (p. ej., 50, 90, 95 y 99 percentiles).

Si ese es el caso, he tenido mucho éxito con el método descrito en "la eficacia de la Computación de la Sesgada de Cuantiles más Flujos de Datos" por Cormode et al. Es un algoritmo rápido que requiere poca memoria y que es fácil de implementar.

El método se basa en un algoritmo anterior por Greenwald y Khanna que mantiene una pequeña muestra de la secuencia de entrada junto con los límites superior e inferior en el rango de los valores en la muestra. Se requiere más espacio que una colección de unos momentos, pero va a ser mucho mejor en el que describe los interesantes de la región de la cola de la distribución precisa.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X