Me corrió un análisis de cluster en una población de clientes. He utilizado variables como:
- Toda la vida
- Pasó cantidad
- etc.
Ahora me gustaría utilizar estos clusters ('comprador', 'Regular fan de la marca', ...) para la segmentación de los efectos.
Problema: que los Futuros clientes se parecen, pero no puedo volver a ejecutar un análisis de conglomerados de cada día, así que tengo que asignar a los nuevos clientes a los actuales grupos.
Propuesta: puede asignar el futuro a los clientes el más cercano centro de gravedad de la actual clusters.
Los nuevos clientes son asignados a grupos que no se han construido para ellos, si la distribución de los nuevos clientes no es el mismo que el de la distribución de la corriente. Por lo tanto, la agrupación se va a deteriorar.
Pregunta: ¿Cómo puedo controlar la evolución de la calidad de la agrupación / segmentación?
Yo estaba pensando en el seguimiento de la evolución de la R Cuadrado (Coeficiente de determinación), porque es la métrica que he utilizado para elegir la real agrupación, pero no estoy seguro de que es una mejor práctica.