He aplicado algoritmos de agrupación como k-mean, k-medoid y DBSCAN en mi conjunto de datos de pacientes. Para cada algoritmo, RapidMiner generó un modelo agrupado (tabla de centroides y gráficos, etc.) y un conjunto agrupado (que muestra qué ejemplos forman parte de cada grupo). Ahora quiero que cuando llegue un nuevo paciente se le asigne un cluster basado en el modelo entrenado anteriormente. Estoy confundido sobre la forma de hacer esto ¿Es algo así (puedo estar equivocado)?
-
Para cada valor de atributo del nuevo paciente - ese valor de atributo de la tabla centroide sumando todas las diferencias de atributos del paciente y tomando la media.
-
A continuación, asígnele el conglomerado cuya media sea mínima con respecto a ese paciente.
Si este es el camino correcto, entonces ¿cómo voy a re-cluster, es decir, cuando un nuevo paciente viene nuestro algoritmo le asigna clúster, es decir. centroide se mueve y entonces tengo que re-cluster con cada inserción de registro. ¿Cómo manejar esto en mi escenario?