2 votos

Cifrado binomial beta

Por ejemplo, supongamos que tenemos una lista de anuncios $\{A_i\}_{i=1}^n$ cada uno de los cuales tiene parámetros $I_i$ el número de impresiones, y $C_i$ el número de clics. A continuación, $C_i/I_i$ denota el porcentaje de clics de la publicidad $i$ .

Estoy escribiendo un muestrario del MAB Thompson, cuyo trabajo consiste en tomar muestras de los anuncios $\{A_i\}$ . Esto funciona mediante el muestreo de unos valores aleatorios según:

$$\theta_i\approx \mbox{Beta}(\alpha+C_i-1,\beta+I_i-C_i-1),$$

tras lo cual elegimos la publicidad $A_s$ , donde $s=\mbox{argmax}_i(\{\theta\}_{i=1}^n)$ .

Por razones de seguridad, no puedo mostrar explícitamente $I_i,C_i$ en cualquier parte del código (esto ocurre en el lado del cliente). Así que estaba pensando que en lugar de entregar $I_i,C_i$ Podría entregar versiones transformadas $\tilde{I}_i,\tilde{C}_i$ de estos, y explotar algunas de las propiedades de equivalencia de las distribuciones beta. Lo que me preocupa es que esto no sea suficiente: si sabes que los valores verdaderos deben ser enteros, entonces quizá haya una forma de recuperar los valores originales. ¿Sugerencias?

0 votos

Tal vez sólo añadir un poco de ruido a $I,C$ ? Si se añade una cantidad razonable de ruido, esto no debería tener un gran impacto en los resultados. Posiblemente habría que comprobar (por ejemplo, mediante una simulación) cuánto ruido es "aceptable" y si añade suficiente secreto. Por otro lado, esto seguiría dando al adversario la oportunidad de conocer los valores aproximados de $I,C$ . También habría que aclarar qué es exactamente lo que será visible para el adversario (por ejemplo, los valores anteriores de $I,C$ (¿o los antecedentes, o sólo ve el estado actual?). Interesante pregunta, pero a primera vista parece bastante desesperada.

0 votos

@Tim: Me gusta la idea del ruido, y me imagino que puedo ofuscarlo como un loco si además lo hago variar con el tiempo de forma determinista. Aunque es un poco arriesgado porque $I/C$ tiende a ser bastante pequeño (digamos 0,01), por lo que el ruido sería mínimo en el mejor de los casos

0 votos

@Tim: Con respecto a la visibilidad, podemos asumir que en algún momento hay una llamada de la función beta anterior, con algún conjunto de parámetros. Ahora mismo están claramente desofuscados como $I$ et $C$ . Podemos suponer que esos parámetros son visibles y, en teoría, un adversario podría recoger los parámetros a lo largo del tiempo.

0voto

Dipstick Puntos 4869

El problema con el uso de cualquier simetría es que son simétricas, por lo que se puede invertir fácilmente, por lo que esto suena más bien como un seguridad a través de la oscuridad estrategia. Bastaría con que tu adversario supiera qué tipo de simetrías utilizaste, para descifrar tus datos.

La simple ofuscación que se puede utilizar aquí es añadir ruido a los valores de $I_i, C_i$ donde la cantidad de ruido es proporcional a los valores alterados. Si se añade una cantidad razonable de ruido, no debería tener un gran impacto en los resultados. Posiblemente habría que comprobar (por ejemplo, mediante una simulación) cuánto ruido es "aceptable" y si añade suficiente secreto. Por otro lado, esto seguiría dando al adversario la oportunidad de conocer los valores aproximados de $I_i, C_i$ .

En los comentarios te preocupa que el $I_i/C_i$ tiende a ser muy pequeña y esto podría acarrear problemas. En primer lugar, si modificas los valores proporcionalmente a sus valores iniciales, esto no debería tener mucho impacto. En segundo lugar, si tu objetivo es muestrear las probabilidades, para asignar aleatoriamente los anuncios, entonces si las probabilidades "ruidosas" fueran ligeramente mayores que el valor real, esto llevaría a mostrar las adiciones más a menudo de lo necesario. En el escenario del bandido de brazos múltiples, esto llevaría a añadir una capa adicional de aleatoriedad para asignar los anuncios y esto no tiene por qué ser malo. Si son más pequeños, esto no debería tener impacto ya que probablemente no elegirás esos anuncios. Se trata de un compromiso entre la precisión y la privacidad, al que hay que enfrentarse.

La idea de añadir ruido a los datos está relacionada con diferencial-privacidad para que puedas leer más sobre la teoría que hay detrás.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X