Estoy tratando de construir un sistema de K-means clustering con 'learing en línea', es decir, existen K clusters y puntos de datos en ellos, y periódicamente hay un nuevo punto de datos que se envía a un grupo apropiado.
El problema es que se produce al intentar reclusterize/redistribuya, ya que se vuelve cada vez más caro con cada nuevo punto de datos. ¿Alguien puede recomendar una solución para esto?