1 votos

¿Cómo reagrupar una nueva instancia en un clustering basado en centroides?

He aplicado algoritmos de agrupación como k-mean, k-medoid y DBSCAN en mi conjunto de datos de pacientes. Para cada algoritmo, RapidMiner generó un modelo agrupado (tabla de centroides y gráficos, etc.) y un conjunto agrupado (que muestra qué ejemplos forman parte de cada grupo). Ahora quiero que cuando llegue un nuevo paciente se le asigne un cluster basado en el modelo entrenado anteriormente. Estoy confundido sobre la forma de hacer esto ¿Es algo así (puedo estar equivocado)?

  1. Para cada valor de atributo del nuevo paciente - ese valor de atributo de la tabla centroide sumando todas las diferencias de atributos del paciente y tomando la media.

  2. A continuación, asígnele el conglomerado cuya media sea mínima con respecto a ese paciente.

Si este es el camino correcto, entonces ¿cómo voy a re-cluster, es decir, cuando un nuevo paciente viene nuestro algoritmo le asigna clúster, es decir. centroide se mueve y entonces tengo que re-cluster con cada inserción de registro. ¿Cómo manejar esto en mi escenario?

1voto

Anne Puntos 11

El resultado de un operador de agrupación es un modelo que puede aplicarse a nuevos datos mediante el operador "Aplicar modelo".

Mientras los nombres de los atributos sean los mismos, todo funcionará. Para el operador DBScan, es posible que tenga que tener un atributo especial con id de rol para que funcione correctamente.

Si necesita reconstruir los clusters con nuevos datos, añada las nuevas filas a los datos existentes, reconstruya el modelo y guárdelo para más tarde.

Espero que le sirva de ayuda.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X