Pablo. Una tasa de conversión se define como:
$\textrm{Conversion rate} = r =\frac{\textrm{Number of goal achievements}}{\textrm{Visits}} = \frac{s}{n}$.
Suponiendo que el número de meta logros básicamente es el número de éxitos $s$ el número de juicios $v$ (en lugar del número de eventos por unidad de tiempo o en el espacio), entonces, ¿qué estás tratando de hacer con su tasa de conversión de datos es la estimación de la subyacente, pero se desconoce la probabilidad de conversión $\kappa$. No hay absolutamente ninguna necesidad de hacer un supuesto de normalidad en la estimación de la tasa o su incertidumbre. En su lugar, puede utilizar el Bayesiano Beta-binomial modelo para la estimación de la distribución de probabilidad de un desconocido proporción.
En la Beta-binomial modelo, su tasa de conversión de datos $v$ sigue una distribución binomial con un tamaño de $n$ y la probabilidad de $\kappa$:
$s \sim \textrm{Bin}(n,\kappa)$
Por supuesto, usted no sabe lo $\kappa$, por lo que vamos a utilizar el teorema de Bayes para calcular mediante la combinación de sus anteriores creencias acerca de lo que la probabilidad podría ser y su tasa de conversión de datos. Resulta que un modelo útil para la distribución de sus priores de las creencias acerca de la probabilidad en este caso es la distribución Beta con la concentración de los parámetros de $\alpha$$\beta$.
$\kappa \sim \textrm{Beta}(\alpha, \beta)$
En la distribución Beta, los parámetros \alpha \beta representar sus creencias anteriores sobre la concentración de los éxitos y fracasos. La mayor concentración parámetro es en relación a otro, mayor es su creencia de que la probabilidad de los favores de ese evento. También, la mayor es la suma de la concentración de los parámetros de $\alpha + \beta$, la más antes de la información que usted tiene sobre la tasa de conversión (es decir, a partir de experimentos anteriores utilizando la misma página de destino), y el más seguro en la probabilidad esperada $\frac{\alpha}{\alpha + \beta}$.
Hay una ingeniosa resultado matemático aquí. Resulta que la distribución posterior de la conversión de probabilidad $\kappa$ sigue una distribución Beta con la concentración de los parámetros de ser una simple modificación de aquellos en la previa. La distribución posterior de la conversión de probabilidad es:
$\textrm{Pr}(\kappa|s,n,\alpha,\beta) \sim \textrm{Beta}(\alpha + s, \beta + n - s)$
Es decir, que acaba de agregar la cuenta en su base de datos a la concentración apropiada de parámetros (\alpha siendo la concentración de éxitos y \beta de fallas), y voila!
Pero, ¿cómo debe de establecer los valores de $\alpha$$\beta$? Si usted tiene información previa acerca de la tasa de conversión de la página de destino, tal vez se podría establecer la concentración de los parámetros de la cuenta de los experimentos anteriores. Pero cuidado: el más grande de la previa del tamaño de la muestra, la más nueva de conversión de datos que se necesitan para abrumar a sus creencias anteriores. A continuación, de nuevo, puede establecer los parámetros de tal manera que el estado espera que el valor de $\frac{\alpha}{\alpha + \beta}$ es igual a la probabilidad de conversión a partir de sus experimentos anteriores, pero elegir los parámetros de modo que su suma es baja, lo que refleja su falta de información sobre la actualidad de la página de destino, es decir, debido a esta página de aterrizaje es muy diferente del anterior. Cómo establecer la previa depende de las circunstancias y de sus creencias, y lo fuerte que esas creencias son.
Otra opción es alegar ignorancia acerca de lo que el valor de $\kappa$ podría ser. En este caso, se podría establecer $\alpha = \beta = 1$, lo que equivale a un continuo uniforme (es decir, plana) antes de la distribución. Algunos sugieren que usted debe utilizar la Jeffrey's antes de la distribución, en $\alpha = \beta = 1/2$, que como una forma de U con los modos 0 y 1.
Independientemente de lo que antes de la distribución que usted elija, ahora se puede estimar el valor esperado de la conversión de la probabilidad, que es:
$\textrm{E}(\kappa|s,n,\alpha,\beta) = \frac{\alpha + s}{\alpha + \beta + n}$
También se podría estimar la parte posterior de la varianza utilizando la fórmula para la distribución Beta de la varianza, o la posteiror mediana, o la posteiror curtosis, o la parte posterior de la asimetría, o lo que sea. Usted podría utilizar un programa de computadora, tales como la investigación para la estimación de la credibilidad del rango para la tasa de conversión dado a sus datos. Por ejemplo, usted podría estimar el posterior 95% intervalo de confianza por un pelotón de R y ejecuta el código siguiente (suponiendo que haya definido $\alpha$, $\beta$, $s$, y $n$ en el código anteriormente):
post_CI <- qbeta(c(0.025, 0.975), alpha, beta)
Usted podría también utilizar simulaciones de la distribución posterior para calcular cualquier número de alternativas de intervalos de credibilidad, como el más alto de la parte posterior de la densidad de intervalo o menor pérdida posterior de intervalo. Deberías buscar en la más alta posterior de la densidad intervalo de tiempo porque la distribución Beta puede ser bastante sesgada, causando la tradicional cuantil intervalo de enfoque para permitir valores en el intervalo que tienen menor probabilidad posterior de los valores que no están en el intervalo. A continuación está el código para el cálculo de la más alta posterior de la densidad de intervalo, suponiendo que se ha definido todo como antes:
sims <- rbeta(1000000, alpha, beta)
require(coda) || install.packages("coda")
post_HDI <- HPDinterval(as.mcmc(sims), prob=0.95)