Processing math: 100%

2 votos

Aplicación del promediado bayesiano a la clasificación

Tengo una muestra con dos métricas y un ratio por atributo. Estoy tratando de clasificar los atributos en función de la relación y las cantidades variables y de mi investigación he encontrado que la mayoría de la gente encuentra Bayesiano Promedio como la mejor fórmula para crear un sistema de clasificación. Estoy tratando de aplicar esta metodología utilizando esta práctica y un ejemplo de esto pregunta pero me estoy confundiendo sobre dónde deben ir las entradas en la respuesta proporcionada.

Aquí están mis variables/ratio:

  • Plomos
  • Suscripciones
  • Lead to Subscription % (Suscripciones/Leads)

Aquí tienes datos de ejemplo:

Atributo | Leads | Suscripciones | Lead to Subscription %

Facebook: 20 | 10 | .5

TV: 4000 | 2000 | .5

LinkedIn: 2000 | 900 | .45

Mi hipótesis aquí es que "TV" es el mayor impulsor de la conversión, seguido de "LinkedIn" debido a que el mayor tamaño de las variables crea un indicador de rendimiento más fuerte que "Facebook", que podría convertir más, pero el tamaño de la variable es pequeño.

A partir de la respuesta a la pregunta enlazada, estoy un poco confundido en cuanto a las entradas que se utilizan en la fórmula proporcionada y cómo puedo traducir mis métricas en la ecuación. ¿Debería "P" = % de suscripciones a clientes potenciales, con un "nr" desconocido y "n" = clientes potenciales?

También se aconseja añadir un valor ficticio a cada cálculo para que tenga un mayor impacto en los tamaños de variable más pequeños y casi ninguno en los más grandes. ¿Le parece correcto este planteamiento?

2voto

Tomaso Neri Puntos 61

Basta con calcular conversión (es decir LtS ),

C=nlns.

En " Promedio bayesiano "necesita una corrección para el número total de clientes potenciales, añadiendo clientes potenciales "ficticios" (p. ej. 200 ), por lo que

C=nlns+200.

Los atributos con un gran número de clientes potenciales ven cómo su conversión modificada se altera muy poco con respecto a la real, mientras que los atributos con relativamente pocos clientes potenciales verán cómo su conversión modificada se desplaza considerablemente hacia valores bajos.

En efecto, los atributos con muchas pistas se clasificarán mejor que los atributos con la misma LtS pero menos pistas.

Mi hipótesis aquí es que "TV" es el mayor impulsor de la conversión, seguido de "LinkedIn" debido a que el mayor tamaño de las variables crea un indicador de rendimiento más fuerte que "Facebook", que podría convertir más, pero el tamaño de la variable es pequeño.

Utilizando sus datos, es

  • C1=0.05
  • C2=0.48
  • C3=0.41

según su suposición.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X