Supongamos que estamos tratando de modelo de la probabilidad de que un usuario hace clic en un anuncio mediante regresión logística. Vamos a recibir sólo la retroalimentación positiva es así, definimos $Y = 1$ cuando el éxito se observó, $Y=0$ lo contrario.
Definimos la probabilidad de que haga clic en un conjunto de características de $X$ $$ P(y_i=1|X=x_i) = \frac{1}{1+e^{-wx_i}} $$
Ahora supongamos que usted debe predecir la probabilidad de que haga clic en tiempo real, de uno en uno cuando se muestra el anuncio, pero los comentarios se retrasa. Y, de la misma manera, a la hora de recuperar los datos para el entrenamiento que tendrá acciones sin retorno y, por tanto, marcado como $Y=0$ pero usted podría recibir retroalimentación positiva horas más tarde y la etiqueta cambiará a $Y=1$.
Tenga en cuenta que los datos no son estacionarias debido a las nuevas características de los valores (o instancias) pueden aparecer en cuestión de minutos, por lo que la formación con los datos de la edad suficiente para asegurarse de que usted reciba toda la posible retroalimentación positiva no es una opción.
Aquí hay un ejemplo que muestra la cantidad acumulada de clics recibidos por horas. Como se puede ver hemos recibido casi el 25% de los clics en la primera hora y el 85% en el 10.
La imagen muestra a la real de la decadencia (en rojo) y el decaimiento exponencial que estamos usando para el modelo (en amarillo). Siguiente:
$$ N(t) = N_0 · e^{-\lambda t}\\ \lambda=-ln(0.15)/C\\ $$
donde $N_0$ es el punto inicial y $C$ es de tiempo transcurrido horas a 85% (por eso $\lambda$ se calcula utilizando 0.15)
En este trabajo de Modelado de Retraso de la Retroalimentación en la Publicidad Display se introdujo el retraso en el modelo en sí, pero estoy tratando de usar el decaimiento exponencial para modelar la variable de salida de la regresión logística para la simplicidad (a pesar de que sería más fácil cambiar las etiquetas de volver a escribir el optimizador). Así, en lugar de
$$ y = \left\{\begin{matrix} 1 & \text{success observed}\\ 0 & \text{otherwise} \end{de la matriz}\right. $$
Estoy tratando de entrenar el modelo de uso de la
$$ y = \left\{\begin{matrix} 1 & \text{success observed}\\ N_0 · e^{-\lambda t} & \text{otherwise} \end{de la matriz}\right. $$
y establecimiento $N_0$ mientras el promedio de la tasa de éxito.
El problema es que no he visto en cualquier lugar donde este método fue usado y no sé si estoy haciendo algo mal, muy mal.
- Es este enfoque válido?
- Cualquier sugerencia o enfoque diferente para introducir el retraso en la retroalimentación en un modelo de regresión logística?
- La regresión logística es buen ajuste distribuciones binomiales pero aquí estoy usando suave etiquetas ($y \in (0, 1)$ en lugar de $y \in \{0, 1\}$). Es este enfoque válido o de regresión logística no va a funcionar bien?