7 votos

¿Cuál es la mejor herramienta para la segmentación de clientes?

Tengo un conjunto de datos de clientes con los siguientes datos:

  • El número de compras que ha realizado cada cliente
  • La fecha en que realizaron cada compra
  • La fecha en que se inscribieron
  • La cantidad que gastaron en cada compra

Quiero segmentar a mis usuarios en tres grupos:

  • Grandes clientes
  • Ok Clientes
  • Clientes malos

¿Existe alguna herramienta que pueda utilizar (método estadístico o herramienta de software) que analice todas las variables y cree las segmentaciones? Tengo Stata y Excel, pero su respuesta no tiene por qué limitarse a ellos.

7 votos

Para segmentar a los clientes, no sus datos, una guillotina

9voto

bavajee Puntos 141

El análisis de supervivencia del LTV (valor de vida) es un buen punto de partida. Es bastante básico, pero hace el trabajo. Pero hay un montón de trabajo de inteligencia empresarial que podrías hacer con lo que tienes. Si tienes tasas de respuesta a los anuncios y demás, también podría proporcionarte una buena forma de ver la eficacia.

Estoy de acuerdo con rolando2, lo bueno, lo malo y lo feo - estar definido matemáticamente, es un reto. Especialmente si no hay ningún elemento de comportamiento o secundario en tus datos que no sean las compras, incluso algo tan simple como el código postal podría añadir una información fantástica a tus datos para entender cosas como el lugar de compra (si es una tienda). Supongo que podrías segmentar por percentiles de LTV... 30%, 50%, 80% (siguiendo la regla comercial 80/20...).

En términos de software, no tengo ni idea de cómo hacer esto en Excel o STATA. Pero, para R hay una introducción mixta y un ejemplo de análisis de supervivencia utilizando el survival paquete aquí: http://www.stats.uwo.ca/faculty/jones/survival_talk.pdf de Bruce Jones en la Universidad de Western Ontario. Soy canadiense, demándame.

En su ejemplo, la Muerte, sería algo así como su tiempo medio entre compras identificado en los datos como 0 o 1 si la observación hizo la compra en el último tiempo medio entre compras . A algunas personas les gusta configurar esto como "Purchased in Last 3 Months"... pero obviamente es diferente para cada tipo de negocio. Usted no compraría un coche cada mes, ¿verdad? Así que es una decisión de juicio en su extremo.

Por lo demás, hay muchas cosas interesantes que se pueden hacer con los datos desde la perspectiva de la inteligencia empresarial. El precio medio de las compras, el número de artículos comprados en una tienda, o los banners en un sitio web si se conoce la hora a la que se colocó el anuncio o la pila .... son sólo algunos ejemplos.

0 votos

¿Cómo se relaciona el análisis de supervivencia con el LTV? El análisis de supervivencia implica un evento discreto (posiblemente recurrente), no un valor continuo (valor de tiempo de vida = $).

1 votos

0 votos

Gracias, miraré el análisis de supervivencia. Cuando dices que hay muchas cosas que puedo hacer desde el punto de vista de la inteligencia empresarial, ¿en qué se diferencia eso de segmentar los datos de los clientes?

8voto

pauly Puntos 932

Me temo que está confundiendo los programas informáticos y los algoritmos estadísticos con seres pensantes y con capacidad de juicio. Ninguna herramienta puede darte lo bueno, lo malo y lo feo. Tendrá que ejercer su propio juicio en el camino. Lo que necesitas no es tanto una herramienta como unos criterios bien pensados para clasificar a cada cliente. Después, el resto es una cuestión de mecánica, o de seguimiento.

6voto

Psycho Bob Puntos 661

Sugeriría que, con sus limitados datos (y quizás con su limitada experiencia con la agrupación), simplemente cree un RFM codificación y separar en los tres contenedores que desee. Por lo demás, el análisis de conglomerados sobre los datos es un método básico para la segmentación de clientes basado en variables transaccionales (por supuesto, sus datos tienen que convertirse en medidas como la distancia entre compras, la permanencia y la recencia de la compra).

0 votos

Me perdí su respuesta de alguna manera (+1) borrado mi duplicado.

0 votos

Gracias por eso. El RFM parece interesante, pero tengo dudas sobre la mejor manera de encontrar descansos significativos para las subcategorías. En el artículo de la wikipedia se menciona el CHAID, que estudiaré.

2voto

Rob Gray Puntos 1556

En general, estoy de acuerdo con rolando2. Sin embargo, si estás interesado en la categorización no supervisada, existen métodos que pueden proporcionarte grupos no etiquetados de tus datos. Uno de estos métodos es el proceso de dirichlet latente (LDA) que se ha utilizado para el descubrimiento automático de temas. K-Means puede ser un método que se ajuste mejor a sus necesidades, especialmente porque conoce el número de categorías que espera.

1voto

Anders Puntos 34448

Una forma de abordar esto es construir un modelo de probabilidad de los datos de los clientes. Si se conoce el comportamiento de los clientes, se puede modelar y predecir quiénes son los más valiosos.

Por ejemplo, se podría suponer que los clientes realizan compras a un ritmo constante hasta que "mueren". Este es el tipo de análisis de supervivencia que mencionó Brandon. También se pueden elaborar modelos más sofisticados que tengan en cuenta la heterogeneidad de las tasas de compra y muerte.

Ya que pregunta por las herramientas de software, también me gustaría sugerirle que visite mi empresa, Custora . Utilizamos algunas versiones más sofisticadas de los modelos que he descrito anteriormente para predecir el valor de vida de los clientes basándonos en los registros de transacciones. Uno de los análisis que ofrecemos es la segmentación de clientes.

2 votos

(-1): Me gustaría evitar que crossvalidated.com degenere en una plataforma en la que en cada pregunta alguien sugiere la herramienta comercial de su empresa. En este caso es mejor colocar anuncios entre las respuestas -,-.

2 votos

Hay muy poco riesgo de tal degeneración, @steffen, porque esta comunidad tiene fuertes defensas incorporadas a través de las actividades de autocontrol y de los moderadores. En este caso la respuesta es legítima, porque incluye la divulgación y explica por qué se ofrece (aunque muy brevemente). Por cierto, si alguna vez te preocupa una respuesta de este tipo, por favor, márcala para que los moderadores la tengan en cuenta (utiliza el enlace "marcar" que hay justo debajo de la respuesta). Nos ocuparemos del problema rápidamente.

1 votos

He pedido herramientas de software, así que señalar una es justo. ¿Cuál es el modelo más sofisticado que está utilizando?

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X