25 votos

¿Es posible entender conceptualmente el modelo pareto/nbd?

Estoy aprendiendo a utilizar el paquete BTYD, que utiliza el modelo Pareto/NBD para predecir cuándo se espera que vuelva un cliente. Sin embargo, toda la literatura sobre este modelo está llena de matemáticas y no parece haber una explicación sencilla/conceptual del funcionamiento de este modelo. ¿Es posible entender el modelo Pareto/NBD para los no matemáticos? He leído este famoso artículo de Fader . El modelo Pareto/NBD parte de los siguientes supuestos:

i. Mientras está activo, el número de transacciones realizadas por un cliente en un periodo de tiempo de longitud t se distribuye Poisson con tasa de transacción .

ii. La heterogeneidad de las tasas de transacción entre clientes sigue una distribución gamma con un parámetro de forma r y un parámetro de escala .

iii. Cada cliente tiene un "tiempo de vida" no observado de longitud . Este punto en el que el cliente se vuelve inactivo se distribuye exponencialmente con una tasa de abandono µ.

iv) La heterogeneidad de las tasas de abandono entre clientes sigue una distribución gamma con parámetro de forma s y parámetro de escala .

v. La tasa de transacciones y la tasa de abandonos µ varían de forma independiente entre los clientes."

No entiendo el fundamento (intuitivo) de los supuestos (ii), (iii) y (iv). ¿Por qué sólo estas distribuciones y no otras?

También son supuestos del modelo BG/NBD:

i.) Mientras está activo, el número de transacciones realizadas por un cliente sigue un proceso de Poisson con tasa de transacción . Esto equivale a suponer que el tiempo entre transacciones se distribuye exponencialmente con la tasa de transacción

ii) La heterogeneidad en sigue una distribución gamma

iii) Después de cualquier transacción, un cliente se vuelve inactivo con probabilidad p. Por lo tanto, el punto en el que el cliente "abandona" se distribuye a través de las transacciones según una distribución geométrica (desplazada) con pmf

iv) La heterogeneidad en p sigue una distribución beta

La racionalidad (intuitiva) de los supuestos (ii), (iii) y (iv) tampoco es nada evidente.

Agradeceré cualquier ayuda. Muchas gracias.

33voto

user124571 Puntos 6

Imagina que eres el recién nombrado gerente de una floristería. Tienes un registro de los clientes del año pasado: la frecuencia con la que compran y cuánto tiempo ha pasado desde su última visita. Quiere saber qué volumen de negocio le reportarán este año esos clientes. Hay que tener en cuenta varias cosas:

[Hipótesis (ii)] Los clientes tienen diferentes hábitos de compra.

A algunas personas les gusta tener flores frescas todo el tiempo, mientras que otras sólo las compran en ocasiones especiales. Es más lógico tener una distribución para la tarifa de transacción $\lambda$ en lugar de suponer que un único $\lambda$ explica el comportamiento de todos.

La distribución debe tener pocos parámetros (no tiene por qué tener muchos datos), ser bastante flexible (es de suponer que no es un gurú empresarial que lee la mente y no lo sabe todo sobre hábitos de compra) y tomar valores en los números reales positivos. La distribución Gamma cumple todos estos requisitos, está bien estudiada y es relativamente fácil trabajar con ella. A menudo se utiliza como prior para parámetros positivos en diferentes contextos.

[Supuesto (iii)] Es posible que ya haya perdido algunos de los clientes de la lista.

Si Andrea ha comprado flores una vez al mes durante el último año, es bastante probable que vuelva este año. Si Ben solía comprar flores semanalmente, pero hace meses que no viene, quizá haya encontrado otra floristería. A la hora de hacer planes de negocio para el futuro, quizá quieras contar con Andrea, pero no con Ben.

Los clientes no le dirán cuándo han cambiado, que es donde entra en juego el supuesto de "vida útil no observada" para ambos modelos. Imaginemos un tercer cliente, Cary. Los modelos Pareto/NBD y BG/NBD nos ofrecen dos maneras distintas de considerar que Cary abandona la tienda para siempre.

Para el caso Pareto/NBD, imagine que en cualquier momento existe una pequeña posibilidad de que Cary encuentre una tienda mejor que la suya. Este riesgo infinitesimal constante nos da la vida exponencial, y cuanto más tiempo ha pasado desde la última visita de Cary, más tiempo ha estado expuesto a otras floristerías (potencialmente mejores).

El caso de BG/NBD es un poco más artificioso. Cada vez que Cary llega a tu tienda, se compromete a comprar flores. Mientras curiosea, tendrá en cuenta los cambios de precio, calidad y variedad que se han producido desde su última visita, lo que, en última instancia, le hará decidir si vuelve la próxima vez o busca otra tienda. Así, en lugar de correr un riesgo constante, Cary tiene cierta probabilidad p de decidir marcharse después de cada compra.

[Suposición (iv)] No todos los clientes están igual de comprometidos con su tienda.

Algunos clientes son asiduos, y sólo la muerte -o una fuerte subida de precios- les obligará a marcharse. A otros les gusta explorar, y te dejarían encantados por la nueva floristería hipster de enfrente. En lugar de una única tasa de abandono para todos los clientes, tiene más sentido tener una distribución de tasas de abandono (o probabilidades en el caso de BG/NBD).

Esto funciona de forma muy similar a los hábitos de compra. Buscamos una distribución flexible, bien establecida y con pocos parámetros. En el caso Pareto/NBD utilizamos una Gamma, ya que la tasa $\mu$ está en los números reales positivos. En el caso BG/NBD utilizamos una Beta, que es la priorización estándar para parámetros en $(0; 1)$ .

Espero que esto ayude. Si aún no lo has hecho, echa un vistazo al artículo original (Schmittlein et al., 1987), donde se explica parte de la intuición.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X