Yo quiero estimar los cuantiles de algunos datos. Los datos son tan grandes que no pueden ser atendidas en la memoria. Y los datos no son estáticos, los nuevos datos que siguen llegando. ¿Alguien conoce un algoritmo para controlar el cuantil(s) de los datos observados hasta ahora con muy limitada de la memoria y de cálculo? Me parece P2 algoritmo útil. Pero no funciona muy bien para mi de datos, los cuales son extremadamente pesado de cola distribuida.
Respuesta
¿Demasiados anuncios?El estado del arte en esta área se ha avanzado algunas de las formas desde mediados de la década de 1980. Las palabras clave que usted debe utilizar en su búsqueda de "stream" y "en línea", ambos términos se utilizan para designar la situación cuando el tamaño del conjunto de datos de entrada (o secuencia) es demasiado grande para almacenar en la memoria.
Específicamente, sugiero comenzar con "Espacio-Eficiente en Línea Cálculo de los Cuantiles de Resúmenes" por Greenwald Y Khanna y "Cómo Resumir el Universo" , a cargo de Gilbert, et. al.