8 votos

Número adecuado de clics para la prueba de tasa de conversión

Necesito la pista de la tasa de conversión de una página de aterrizaje. Quiero averiguar cuántos clics tengo que llegar antes de que me puede estar seguro de que tiene un preciso cálculo de la tasa de conversión.

Yo primero pensé que sería calcular el intervalo de confianza utilizando la fórmula apropiada para una proporción, y encontrar el número de clics necesarios para hacer que el intervalo lo suficientemente apretado. Sin embargo, según este enlace necesitas al menos 1.000 clics antes de que usted puede asumir que la distribución es normal. Lamentablemente yo no puedo conseguir que el número de clics para todos mis páginas de aterrizaje. (Estoy usando páginas de aterrizaje como un paralelo de lo que realmente estoy haciendo - en realidad estoy probando cientos de CPA la publicidad de sus tasas de conversión que me impide dar a cada uno de los miles de clics. Este detalle no cambia el problema, sin embargo, por lo que puede ser ignorada).

Entonces tuve una idea diferente - me gustaría ir a través de un clic/conversión de datos que tengo hasta el momento anterior de las páginas de destino el uso de diferentes "tamaños de ventana", tal como una ventana de 10 clics, 50 clics, 100 clics, 200 clics, etc. Para cada tamaño de la ventana, me gustaría ir a través de cada clic en orden secuencial y calcular la tasa de conversión utilizando la siguiente x clics, a partir de la que estoy examinando. Me gustaría entonces calcular la varianza de las tasas de conversión que he encontrado. Me gustaría encontrar un tamaño de ventana que me da una cantidad deseada de mínima varianza a través de la mayoría de las páginas de destino y, a continuación, utilizarlo como el número de clics para la prueba para pruebas futuras.

¿Este enfoque parece tener sentido / alguien ha oído hablar de algo parecido? Probablemente lo que es más importante, ¿cuál es la forma normal para lograr este objetivo?

Gracias!

4voto

shyam Puntos 4133

Pablo. Una tasa de conversión se define como:

$\textrm{Conversion rate} = r =\frac{\textrm{Number of goal achievements}}{\textrm{Visits}} = \frac{s}{n}$.

Suponiendo que el número de meta logros básicamente es el número de éxitos $s$ el número de juicios $v$ (en lugar del número de eventos por unidad de tiempo o en el espacio), entonces, ¿qué estás tratando de hacer con su tasa de conversión de datos es la estimación de la subyacente, pero se desconoce la probabilidad de conversión $\kappa$. No hay absolutamente ninguna necesidad de hacer un supuesto de normalidad en la estimación de la tasa o su incertidumbre. En su lugar, puede utilizar el Bayesiano Beta-binomial modelo para la estimación de la distribución de probabilidad de un desconocido proporción.

En la Beta-binomial modelo, su tasa de conversión de datos $v$ sigue una distribución binomial con un tamaño de $n$ y la probabilidad de $\kappa$:

$s \sim \textrm{Bin}(n,\kappa)$

Por supuesto, usted no sabe lo $\kappa$, por lo que vamos a utilizar el teorema de Bayes para calcular mediante la combinación de sus anteriores creencias acerca de lo que la probabilidad podría ser y su tasa de conversión de datos. Resulta que un modelo útil para la distribución de sus priores de las creencias acerca de la probabilidad en este caso es la distribución Beta con la concentración de los parámetros de $\alpha$$\beta$.

$\kappa \sim \textrm{Beta}(\alpha, \beta)$

En la distribución Beta, los parámetros \alpha \beta representar sus creencias anteriores sobre la concentración de los éxitos y fracasos. La mayor concentración parámetro es en relación a otro, mayor es su creencia de que la probabilidad de los favores de ese evento. También, la mayor es la suma de la concentración de los parámetros de $\alpha + \beta$, la más antes de la información que usted tiene sobre la tasa de conversión (es decir, a partir de experimentos anteriores utilizando la misma página de destino), y el más seguro en la probabilidad esperada $\frac{\alpha}{\alpha + \beta}$.

Hay una ingeniosa resultado matemático aquí. Resulta que la distribución posterior de la conversión de probabilidad $\kappa$ sigue una distribución Beta con la concentración de los parámetros de ser una simple modificación de aquellos en la previa. La distribución posterior de la conversión de probabilidad es:

$\textrm{Pr}(\kappa|s,n,\alpha,\beta) \sim \textrm{Beta}(\alpha + s, \beta + n - s)$

Es decir, que acaba de agregar la cuenta en su base de datos a la concentración apropiada de parámetros (\alpha siendo la concentración de éxitos y \beta de fallas), y voila!

Pero, ¿cómo debe de establecer los valores de $\alpha$$\beta$? Si usted tiene información previa acerca de la tasa de conversión de la página de destino, tal vez se podría establecer la concentración de los parámetros de la cuenta de los experimentos anteriores. Pero cuidado: el más grande de la previa del tamaño de la muestra, la más nueva de conversión de datos que se necesitan para abrumar a sus creencias anteriores. A continuación, de nuevo, puede establecer los parámetros de tal manera que el estado espera que el valor de $\frac{\alpha}{\alpha + \beta}$ es igual a la probabilidad de conversión a partir de sus experimentos anteriores, pero elegir los parámetros de modo que su suma es baja, lo que refleja su falta de información sobre la actualidad de la página de destino, es decir, debido a esta página de aterrizaje es muy diferente del anterior. Cómo establecer la previa depende de las circunstancias y de sus creencias, y lo fuerte que esas creencias son.

Otra opción es alegar ignorancia acerca de lo que el valor de $\kappa$ podría ser. En este caso, se podría establecer $\alpha = \beta = 1$, lo que equivale a un continuo uniforme (es decir, plana) antes de la distribución. Algunos sugieren que usted debe utilizar la Jeffrey's antes de la distribución, en $\alpha = \beta = 1/2$, que como una forma de U con los modos 0 y 1.

Independientemente de lo que antes de la distribución que usted elija, ahora se puede estimar el valor esperado de la conversión de la probabilidad, que es:

$\textrm{E}(\kappa|s,n,\alpha,\beta) = \frac{\alpha + s}{\alpha + \beta + n}$

También se podría estimar la parte posterior de la varianza utilizando la fórmula para la distribución Beta de la varianza, o la posteiror mediana, o la posteiror curtosis, o la parte posterior de la asimetría, o lo que sea. Usted podría utilizar un programa de computadora, tales como la investigación para la estimación de la credibilidad del rango para la tasa de conversión dado a sus datos. Por ejemplo, usted podría estimar el posterior 95% intervalo de confianza por un pelotón de R y ejecuta el código siguiente (suponiendo que haya definido $\alpha$, $\beta$, $s$, y $n$ en el código anteriormente):

post_CI <- qbeta(c(0.025, 0.975), alpha, beta)

Usted podría también utilizar simulaciones de la distribución posterior para calcular cualquier número de alternativas de intervalos de credibilidad, como el más alto de la parte posterior de la densidad de intervalo o menor pérdida posterior de intervalo. Deberías buscar en la más alta posterior de la densidad intervalo de tiempo porque la distribución Beta puede ser bastante sesgada, causando la tradicional cuantil intervalo de enfoque para permitir valores en el intervalo que tienen menor probabilidad posterior de los valores que no están en el intervalo. A continuación está el código para el cálculo de la más alta posterior de la densidad de intervalo, suponiendo que se ha definido todo como antes:

sims <- rbeta(1000000, alpha, beta)
require(coda) || install.packages("coda")
post_HDI <- HPDinterval(as.mcmc(sims), prob=0.95)

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X