Por ejemplo, supongamos que tenemos una lista de anuncios $\{A_i\}_{i=1}^n$ cada uno de los cuales tiene parámetros $I_i$ el número de impresiones, y $C_i$ el número de clics. A continuación, $C_i/I_i$ denota el porcentaje de clics de la publicidad $i$ .
Estoy escribiendo un muestrario del MAB Thompson, cuyo trabajo consiste en tomar muestras de los anuncios $\{A_i\}$ . Esto funciona mediante el muestreo de unos valores aleatorios según:
$$\theta_i\approx \mbox{Beta}(\alpha+C_i-1,\beta+I_i-C_i-1),$$
tras lo cual elegimos la publicidad $A_s$ , donde $s=\mbox{argmax}_i(\{\theta\}_{i=1}^n)$ .
Por razones de seguridad, no puedo mostrar explícitamente $I_i,C_i$ en cualquier parte del código (esto ocurre en el lado del cliente). Así que estaba pensando que en lugar de entregar $I_i,C_i$ Podría entregar versiones transformadas $\tilde{I}_i,\tilde{C}_i$ de estos, y explotar algunas de las propiedades de equivalencia de las distribuciones beta. Lo que me preocupa es que esto no sea suficiente: si sabes que los valores verdaderos deben ser enteros, entonces quizá haya una forma de recuperar los valores originales. ¿Sugerencias?
0 votos
Tal vez sólo añadir un poco de ruido a $I,C$ ? Si se añade una cantidad razonable de ruido, esto no debería tener un gran impacto en los resultados. Posiblemente habría que comprobar (por ejemplo, mediante una simulación) cuánto ruido es "aceptable" y si añade suficiente secreto. Por otro lado, esto seguiría dando al adversario la oportunidad de conocer los valores aproximados de $I,C$ . También habría que aclarar qué es exactamente lo que será visible para el adversario (por ejemplo, los valores anteriores de $I,C$ (¿o los antecedentes, o sólo ve el estado actual?). Interesante pregunta, pero a primera vista parece bastante desesperada.
0 votos
@Tim: Me gusta la idea del ruido, y me imagino que puedo ofuscarlo como un loco si además lo hago variar con el tiempo de forma determinista. Aunque es un poco arriesgado porque $I/C$ tiende a ser bastante pequeño (digamos 0,01), por lo que el ruido sería mínimo en el mejor de los casos
0 votos
@Tim: Con respecto a la visibilidad, podemos asumir que en algún momento hay una llamada de la función beta anterior, con algún conjunto de parámetros. Ahora mismo están claramente desofuscados como $I$ et $C$ . Podemos suponer que esos parámetros son visibles y, en teoría, un adversario podría recoger los parámetros a lo largo del tiempo.
0 votos
Si $I/C$ son pequeñas, entonces la probabilidad de muestreo de dicha clase sería también pequeña. No soy un experto en bandidos multiarmados, pero en muchos casos no te gustaría que fuera cercano a cero, ya que querrías tener alguna posibilidad de probar cada caso. Así que no debería haber ningún problema en reemplazar esos valores con algo que sea mayor que el valor inicial.